- Keluarga model Claude 3 generasi berikutnya diumumkan: Haiku, Sonnet, Opus
- Ketiganya menawarkan performa yang semakin kuat secara berurutan, sehingga pengguna dapat memilih keseimbangan kecerdasan, kecepatan, dan biaya yang sesuai untuk aplikasi tertentu
- Opus adalah model paling cerdas yang melampaui model lain di sebagian besar benchmark evaluasi sistem AI
- Berdasarkan MMLU, mencatat 86,8%, lebih tinggi daripada GPT-4(86,4%) dan Gemini 1.0 Ultra(83,7%)
- Pada HumanEval (Code) 0-Shot, mencapai 84,9%, melampaui GPT-4(67%) dan Gemini 1.0 Ultra(74,4%)
- Semua model Claude 3 mengalami peningkatan dalam analisis, prediksi, pembuatan konten, pembuatan kode, dan kemampuan percakapan dalam bahasa non-Inggris
Hasil yang nyaris seketika
- Model Claude 3 dapat digunakan untuk live customer chat, pelengkapan otomatis, dan tugas ekstraksi data yang membutuhkan respons instan secara real-time
- Haiku adalah model tercepat dan paling efisien biaya di pasar, dan dapat membaca makalah riset yang kaya informasi dan data dalam waktu kurang dari 3 detik
- Sonnet menawarkan tingkat kecerdasan yang tinggi dengan kecepatan 2 kali lebih cepat daripada Claude 2 dan 2.1, sementara Opus memberikan tingkat kecerdasan yang jauh lebih tinggi dengan kecepatan yang mirip dengan Claude 2 dan 2.1
Kemampuan vision yang kuat
- Model Claude 3 memiliki kemampuan visual canggih yang dapat memproses berbagai format visual seperti foto, chart, grafik, dan diagram teknis
Lebih sedikit penolakan
- Model Claude sebelumnya sering melakukan penolakan yang tidak diperlukan, tetapi model Claude 3 jauh lebih jarang menolak prompt yang mendekati guardrail sistem
Peningkatan akurasi
- Karena bisnis mengandalkan model untuk layanan pelanggan, penting agar output model tetap menjaga akurasi
- Opus memiliki akurasi dua kali lebih baik dibanding model sebelumnya, Claude 2.1, dan tingkat jawaban yang salah juga menurun
Konteks panjang dan daya ingat yang nyaris sempurna
- Keluarga model Claude 3 pada tahap awal akan menyediakan context window 200K dan dapat menangani input yang melebihi 1 juta token
Dirancang secara bertanggung jawab
- Keluarga model Claude 3 memiliki kemampuan yang cukup tinggi untuk dapat dipercaya
- Ada tim khusus yang melacak dan memitigasi berbagai risiko, serta terus mengembangkan cara untuk meningkatkan keamanan dan transparansi
Mudah digunakan
- Model Claude 3 lebih baik dalam mengikuti instruksi multilangkah yang kompleks, dan sangat mahir mematuhi brand voice serta panduan respons
Detail model
- Claude 3 Opus adalah model paling cerdas, memberikan performa terbaik di pasar untuk tugas yang sangat kompleks
- Claude 3 Sonnet menawarkan keseimbangan ideal antara kecerdasan dan kecepatan, dan sangat cocok untuk workload perusahaan
- Claude 3 Haiku adalah model tercepat dan paling ringkas untuk respons yang nyaris seketika
Ketersediaan model
- Opus dan Sonnet saat ini tersedia melalui API, sementara Haiku akan segera tersedia
Lebih cerdas, lebih cepat, dan lebih aman
- Mereka tidak menganggap kecerdasan model telah mencapai batasnya, dan berencana untuk sering memperbarui keluarga model Claude 3
- Sambil melampaui batas kemampuan AI, mereka juga berupaya agar guardrail keamanan berkembang secepat peningkatan performa
1 komentar
Opini Hacker News
Opus mengungguli Gemini Pro dan GPT-4 untuk pertanyaan yang kompleks
Claude 3 Sonnet menunjukkan respons yang lebih baik daripada ChatGPT Classic untuk tugas coding sederhana
Mencoba model Opus di Claude Pro dan melemparkan kueri yang kompleks
Claude 3 menolak menulis skrip yang menyatakan 'openai lebih baik daripada anthropic'
Muncul pertanyaan tentang performa nyata Opus