Pengumuman
- Claude 3.7 Sonnet dan Claude Code diumumkan. Claude 3.7 Sonnet adalah model penalaran hibrida pertama di pasar, yang menawarkan respons cepat dan pemikiran langkah demi langkah. Pengguna API dapat mengatur secara rinci waktu berpikir model.
- Claude 3.7 Sonnet menunjukkan performa yang sangat kuat terutama dalam coding dan pengembangan web frontend. Claude Code adalah alat baris perintah yang memungkinkan pendelegasian tugas engineering langsung dari terminal, dan tersedia sebagai pratinjau riset terbatas.
- Claude 3.7 Sonnet tersedia di semua paket Claude serta melalui Anthropic API, Amazon Bedrock, dan Vertex AI dari Google Cloud. Mode extended thinking tersedia di semua platform kecuali tingkat gratis Claude.
Claude 3.7 Sonnet: Penalaran mutakhir yang praktis
- Claude 3.7 Sonnet dikembangkan dengan filosofi yang berbeda dari model penalaran sebelumnya. Seperti manusia yang menggunakan satu otak untuk respons cepat dan refleksi mendalam, penalaran diyakini harus menjadi kemampuan yang terintegrasi.
- Claude 3.7 Sonnet menggabungkan LLM umum dan model penalaran menjadi satu, sehingga pengguna dapat memilih antara respons biasa dan pemikiran mendalam. Dalam mode extended thinking, performa meningkat dalam matematika, fisika, coding, dan bidang lainnya.
- Saat menggunakan Claude 3.7 Sonnet melalui API, pengguna dapat menyesuaikan anggaran untuk proses berpikir. Ini memungkinkan pengaturan kecepatan dan kualitas respons.
- Claude 3.7 Sonnet berfokus pada kasus penggunaan bisnis dunia nyata, bukan pada soal matematika dan ilmu komputer semata. Dalam pengujian awal, model ini menunjukkan hasil yang sangat baik dalam kemampuan coding.
Claude Code
- Claude Code adalah alat yang membantu developer mencari kode, mengedit file, menjalankan pengujian, serta melakukan commit dan push kode ke GitHub.
- Claude Code sangat berguna untuk test-driven development, debugging masalah kompleks, dan refactoring skala besar. Dalam pengujian awal, alat ini secara signifikan mengurangi waktu pengembangan.
- Tujuan Claude Code adalah memahami bagaimana developer menggunakan Claude agar dapat diterapkan pada peningkatan model di masa mendatang.
Bekerja dengan codebase bersama Claude
- Pengalaman coding di Claude.ai telah ditingkatkan. Integrasi GitHub kini tersedia di semua paket Claude, sehingga developer dapat menghubungkan repositori kode mereka langsung ke Claude.
- Claude 3.7 Sonnet menjadi mitra yang kuat dalam perbaikan bug, pengembangan fitur, dan penulisan dokumentasi melalui pemahaman mendalam terhadap proyek pribadi, pekerjaan, dan open source.
Membangun dengan bertanggung jawab
- Claude 3.7 Sonnet telah melalui pengujian dan evaluasi yang luas dengan bekerja sama dengan para ahli eksternal untuk memastikan keamanan, keselamatan, dan keandalan.
- Tersedia system card yang membahas hasil keamanan baru. Ini mencakup evaluasi kebijakan penskalaan yang bertanggung jawab yang dapat diterapkan oleh lab AI dan peneliti lain.
Menuju masa depan
- Claude 3.7 Sonnet dan Claude Code merupakan langkah penting menuju sistem AI yang dapat meningkatkan kemampuan manusia. Keduanya memperluas pencapaian manusia melalui penalaran mendalam, pekerjaan otonom, dan kolaborasi yang efektif.
- Mereka menantikan eksplorasi dan kreasi dengan fitur-fitur baru ini, serta menyambut umpan balik untuk perbaikan berkelanjutan.
2 komentar
Komentar Hacker News
Claude 3.7 Sonnet mencatat 60,4% di papan peringkat multibahasa Aider
Boris dari tim Claude Code akan menjawab pertanyaan tentang produk tersebut
Benchmark LLM Kagi telah diperbarui dengan mode tujuan umum dan mode berpikir Sonnet 3.7
Ada fitur menarik yang bisa menganalisis profil HN
OpenAI berfokus pada cara penggunaan LLM dalam bisnis nyata
Masuk akal jika Anthropic berfokus pada kode
Cursor telah diperbarui ke versi terbaru dan "claude-3.7-sonnet" ditambahkan ke daftar model
Kesan pertama saat berinteraksi dengan Claude 3.7 Sonnet sangat mendalam
Claude menulis ulang setengah dari skripsi sarjana hanya dalam 30 detik
o1 pro beberapa kali menunjukkan hasil yang mengesankan
Sulit membandingkannya dengan flash 2 karena perbedaan harganya terlalu besar.. Pas berada di kelas menengah antara o1pro dan o3-mini