Anthropic, merilis Claude 2.1

(anthropic.com)

2 poin oleh GN⁺ 2023-11-22 | 1 komentar | Bagikan ke WhatsApp

Claude 2.1 tersedia melalui API dan menghadirkan pengalaman chat claude.ai.
Fitur utamanya mencakup context window 200K token, pengurangan halusinasi model, system prompt, serta penggunaan alat sebagai fitur beta baru
Pembaruan kebijakan harga akan dilakukan untuk meningkatkan efisiensi biaya bagi pelanggan

Context window 200K

Pengguna Claude menginginkan context window yang lebih besar dan output yang lebih akurat saat bekerja dengan dokumen panjang
Dengan 200.000 token, sekitar 150.000 kata atau lebih dari 500 halaman materi dapat diberikan ke Claude
Claude dapat berinteraksi dengan konten atau data berskala besar untuk melakukan berbagai tugas seperti peringkasan, tanya jawab, prediksi tren, dan perbandingan banyak dokumen

Tingkat halusinasi turun 2x

Claude 2.1 mengurangi tingkat kemunculan pernyataan palsu hingga 2x untuk meningkatkan kejujuran
Perusahaan dapat membangun aplikasi AI dan menerapkannya ke operasional dengan kepercayaan dan keandalan yang lebih tinggi
Claude 2.1 menunjukkan peningkatan dalam pemahaman dan kemampuan merangkum, terutama peningkatan performa pada dokumen panjang dan kompleks yang menuntut akurasi

API Tool Use

Ditambahkan fitur beta baru "Tool Use" yang dapat diintegrasikan dengan proses, produk, dan API yang sudah ada milik pengguna
Claude dapat mengoordinasikan fungsi atau API yang didefinisikan pengembang, menelusuri sumber web, dan mencari informasi dari basis pengetahuan pribadi
Tool Use masih berada pada tahap pengembangan awal, dan fitur pengembang serta pedoman prompt sedang dibangun

Pengalaman pengembang

Pengalaman konsol pengembang untuk pengguna API Claude disederhanakan, dan pengujian prompt baru menjadi lebih mudah
Melalui produk workbench baru, pengembang dapat mengiterasi prompt dan mengakses pengaturan model untuk mengoptimalkan perilaku Claude
System prompt diperkenalkan agar pengguna dapat memberikan instruksi kustom kepada Claude

Opini GN⁺

Fitur paling penting dari Claude 2.1 adalah context window 200K token dan penurunan tingkat halusinasi, yang memungkinkan pengguna memproses dokumen dan data yang lebih besar serta mendapatkan hasil yang lebih dapat dipercaya
Fitur-fitur ini menunjukkan kemajuan teknologi AI dan memiliki potensi untuk merevolusi pekerjaan perusahaan dan pengembang dengan menyediakan alat yang lebih efisien dan akurat
Artikel ini memuat konten yang menarik bagi orang-orang yang tertarik pada teknologi dengan menghadirkan informasi terbaru tentang tren teknologi AI dan alat baru yang dapat digunakan pengembang

1 komentar

GN⁺ 2023-11-22

Opini Hacker News

Manis-pahit konteks 200k: Disayangkan tingkat kesalahan melonjak tajam dari 70k ke 195k. Namun, penurunan kesalahan di bagian tengah patut diapresiasi.
Keluhan tentang penggunaan model yang terbatas: Claude tidak sesedikit itu menolak seperti yang diklaim judul. Anthropic terlalu banyak menyensor model sehingga sulit digunakan. Pengguna seharusnya yang menentukan alat, bukan alat yang menentukan pengguna.
Menunjukkan ketidaksesuaian antara judul dan isi: 'Penurunan penolakan' yang disebut dalam pengumuman tidak sesuai dengan isi sebenarnya. Ini mengisyaratkan bahwa Claude 2.1 lebih cenderung menolak daripada memberikan informasi yang salah.
Ketidakefisienan untuk coding: 10 kali lebih buruk dibanding GPT-4. Saat diminta fungsi sinkronisasi database sederhana, model banyak memberikan pseudocode alih-alih kode yang benar-benar bisa dipakai.
Kesan negatif terhadap model: Model Anthropic dilatih secara berlebihan untuk menolak sebagian besar permintaan, sehingga percakapan dengan Claude terasa tidak menyenangkan.
Contoh penolakan dari sudut pandang ideologis: Situasi lucu muncul ketika model menolak permintaan daftar kosakata untuk berbicara seperti seorang effective altruist.
Kekecewaan terhadap Claude 2: Awalnya ada harapan, tetapi performanya dinilai jauh di bawah GPT-4; konteks window besar tidak berarti jika kualitas jawabannya buruk.
Masalah aksesibilitas penggunaan API: Tertarik menggunakan API, tetapi kecewa karena tidak menerima respons. Terlihat kurang berminat sebagai platform pengembang.
Sulitnya akses API: Tidak mendapat respons atas permintaan melalui situs web Anthropic maupun Bedrock, sehingga akses API sebagai bisnis tampak tidak memungkinkan.
Ketertarikan pada diperkenalkannya system prompt: Perhatian tertuju pada system prompt yang memungkinkan pengguna memberi instruksi khusus kepada Claude untuk meningkatkan performa. Ada ekspektasi terhadap kemudahan penggunaan sekaligus potensi penyalahgunaannya.
Penggunaan Claude untuk pengujian dan pilihan OpenAI: Belum digunakan di produksi, tetapi rutin dimasukkan dalam pengujian saat membangun fitur baru dengan LLM. OpenAI lebih cepat mendapat persetujuan dan meluncur ke pasar, API-nya lebih baik, lebih andal, dan lebih murah. Namun, dengan Claude yang kini tersedia di AWS Bedrock, hal-hal yang sebelumnya tidak mungkin menjadi mungkin.

Anthropic, merilis Claude 2.1

Context window 200K

Tingkat halusinasi turun 2x

API Tool Use

Pengalaman pengembang

Opini GN⁺

Bacaan terkait

1 komentar

Opini Hacker News