Menanamkan Claude ke Apple Foundation Models
(platform.claude.com)- Paket Swift yang menghubungkan framework Foundation Models milik Apple dengan Claude sebagai model sisi server, sehingga developer bisa memanggil Claude melalui jalur kode yang sama persis dengan model on-device Apple
- Berkat protokol
LanguageModelyang diperkenalkan Apple di WWDC 2026, kini dimungkinkan arsitektur hibrida dengan satu API standar: prototipe dibuat dengan model on-device lalu hanya pekerjaan yang kompleks yang dialihkan ke model cloud - Intinya adalah kemampuan menukar provider - tanpa menyentuh logika sesi, developer bisa berpindah antara Apple, Claude, dan Gemini hanya dengan mengganti dependensi Swift Package
- Paket yang dirilis Anthropic di bawah Apache 2.0 ini merupakan contoh pertama yang benar-benar berjalan dari gagasan “bisa terhubung ke backend apa pun”
- Permintaan dikirim langsung dari aplikasi ke Claude API dan Apple tidak berada di jalur tersebut, sehingga tidak dapat melihat prompt maupun respons, dan biaya juga ditagihkan langsung ke akun Anthropic
Mengapa ini penting
- Selama ini, untuk menambahkan model bahasa ke aplikasi iOS, developer harus mendaftar API cloud terpisah, mengelola key, membayar per token, dan mengirim semua prompt ke luar perangkat. Di WWDC 2026, Apple akhirnya mengatasi ketidaknyamanan lama ini
- Framework Foundation Models diperluas sehingga model on-device Apple Intelligence, Private Cloud Compute, dan cloud pihak ketiga seperti Claude dan Gemini semuanya bisa dipanggil lewat satu API Swift native
- Anthropic merilis paket Swift yang mengimplementasikan protokol baru ini. Tujuannya adalah menerima alur dari model on-device Apple lalu memanggil Claude untuk menangani workflow yang lebih kompleks
Apa yang berubah bagi developer
-
Pergantian provider tanpa perubahan kode
- Setelah membuat prototipe aplikasi dengan model on-device Apple, developer dapat merutekan kueri kompleks ke Google Gemini atau Anthropic Claude, atau beralih di antaranya, hanya dengan memperbarui dependensi Swift Package Manager tanpa mengubah logika sesi maupun kode aplikasi lainnya
- Model on-device dipakai untuk tugas cepat dan lokal seperti ringkasan dan ekstraksi, lalu hanya melakukan handoff ke Claude saat dibutuhkan penalaran multilangkah, pembuatan kode, pencarian web, atau eksekusi kode
- Dalam kedua kasus, API yang digunakan tetap
LanguageModelSession, sehingga perpindahan cukup dilakukan dengan mengganti argumenmodel:
-
Handoff berbasis tipe
- Setelah menambahkannya ke proyek dan login dengan API key Anthropic, output terketik dari model on-device Apple dapat diteruskan ke permintaan Claude, lalu paket ini menangani streaming, pemanggilan tool, dan respons terstruktur kembali ke view SwiftUI
- Dengan pembuatan guide, penggunaannya cukup sederhana hingga bisa mengembalikan nilai Swift yang terketik hanya dengan tiga baris kode
Struktur privasi dan biaya
- Permintaan dikirim langsung dari aplikasi ke Claude API sehingga Apple tidak berada di jalur permintaan dan tidak dapat melihat prompt maupun respons
- Pemakaian ditagihkan langsung ke akun Anthropic dengan harga API standar
- Aplikasi menentukan sendiri per sesi apakah akan memakai Claude atau model on-device Apple
Gambaran yang lebih besar
- Apple berencana mengubah framework Foundation Models menjadi open source musim panas ini, yakni API Swift native untuk model on-device yang dirilis pada 2025. Dengan protokol LanguageModel yang baru, hampir semua model—baik model Apple sendiri maupun provider jarak jauh—dapat menjalankan LanguageModelSession di balik satu API Swift tunggal
- Sebagai contoh dari gagasan “bisa terhubung ke backend apa pun” itu, ClaudeForFoundationModels dari Anthropic mewujudkan pola adapter secara konkret
- Apple juga memosisikan sistem Dynamic Profiles, yang memungkinkan aplikasi mengganti model, tool, dan instruksi di tengah sesi, sebagai fondasi untuk workflow multi-agent
- Namun, integrasi ini masih dalam tahap beta yang memerlukan iOS, iPadOS, macOS, visionOS, watchOS 27, dan Xcode 27, sehingga API masih bisa berubah sebelum rilis resmi
1 komentar
Komentar Hacker News
Apple sedang mengendalikan pengalaman pengguna sambil menjadikan LLM sebagai komoditas umum
Sesuai karakter perusahaan hardware, strateginya tampak seperti terus menjual mesin terbaik untuk menggunakan AI, dan itu terlihat sebagai pilihan yang tepat
Mereka menginvestasikan miliaran dolar ke infrastruktur, tetapi nilainya justru diambil perusahaan lain yang berada di lapisan lebih atas
Perusahaan yang tidak beradaptasi pada akhirnya tak punya pilihan selain menyerah setelah dihajar web scraper DIY berbasis AI buatan orang-orang
Ungkapan seperti menjadikan LLM sebagai komoditas mungkin tepat, tetapi ini adalah fitur yang berhadapan langsung dengan pengguna dan sudah mereka poles selama beberapa tahun
Jadi ini paket Swift yang memungkinkan memakai Claude sebagai model bahasa sisi server di
Apple's Foundation Models framework, padahal saya mengira arahnya akan sebaliknya. Saya berharap fitur-fitur Claude Code yang ada somehow bisa berjalan secara lokal di Neural Engine laptop sayaDengan M2 dan RAM 8GB itu memang angan-angan, tapi sempat memberi sedikit harapan
https://developer.apple.com/videos/play/wwdc2026/232/
https://www.youtube.com/watch?v=wykPErJ8M-8
Namun pada kenyataannya yang didapat adalah Claude yang bahkan tidak jelas di-host di mana. Bisa saja di data center X-AI, bisa saja di suatu tempat milik Amazon, tidak ada yang tahu
Ini bukan khusus untuk Claude. Developer juga bisa membuat aplikasi yang memanggil model Gemini berbasis server milik Google
Di WWDC, Apple mengumumkan akan membuka Foundation Models framework untuk penyedia model cloud pihak ketiga. Mulai iOS 27, macOS 27, iPadOS 27, visionOS 27, dan watchOS 27, penyedia model dapat mengimplementasikan
LanguageModelprotocol publik yang baru untuk menyediakan antarmuka umum bagi inferensi model. Google telah memungkinkan model Gemini digunakan di Foundation Models framework melalui Firebase Apple SDKDengan ini, pengalaman pengembangan native penuh menjadi mungkin. Model Gemini yang di-host di cloud dapat terhubung langsung ke Foundation Models framework lewat API yang sama, dan model Apple di perangkat serta model Gemini yang di-host di cloud ditempatkan di balik permukaan API yang sama, sehingga inferensi lokal dan inferensi cloud bisa dengan mudah ditukar sesuai kebutuhan use case
https://blog.google/innovation-and-ai/technology/developers-...
language model protocol, dan sebelum kita dikutuk oleh istilah yang sangat panjang itu, semua orang sebaiknya cepat berkumpul di sisi iniSenang melihat Apple memperkenalkan abstraksi seperti ini, tetapi kekhawatiran utama ada di sisi model lokal
Misalnya, walaupun ingin memakai Gemma4, dari sudut pandang pengguna kalau 10 aplikasi masing-masing mengunduh model yang sama, ponsel jadi membengkak tanpa perlu
Saya masih belum paham apakah Apple menyediakan cara agar banyak aplikasi bisa memakai model yang sama di perangkat yang sama. Ini harus bisa dilakukan tanpa namespace yang merepotkan atau trik perizinan
Saya belum melihat sesuatu yang mengisyaratkan itu
Ini salah ketika model di perangkat tertinggal jauh, tetapi dalam jangka panjang mungkin tetap benar
Banyak aplikasi yang saya pakai mungkin membutuhkan Gemma 4 E4B, tetapi saya memakai puluhan aplikasi dan para pengembang bisa memilih dari ratusan model. Shared cache mungkin sedikit mengurangi ukuran saat ada tumpang tindih, tetapi masalah intinya tetap ada. Jika tiap aplikasi memilih modelnya sendiri, disk dan swapping memori akan meledak
Kemungkinan besar lebih baik jika pembuat perangkat menanamkan default bawaan. Ini bukan berarti melarang penggunaan model lain, tetapi satu default bersama mungkin adalah pilihan terbaik bagi 99% aplikasi, baik dari sisi pengalaman pengembang maupun pengguna
Fakta bahwa model itu sudah dimuat di memori adalah peningkatan performa terbesar, dan model default jauh lebih mungkin tetap hangat
“Model terbaik” biasanya adalah “model terbaik untuk perangkat ini” dengan mempertimbangkan RAM dan beban komputasi. Pengembang tidak bisa menguji semua perangkat, tetapi Apple bisa dan akan melakukannya
Tiap model harus dioptimalkan untuk perangkat keras. Penting untuk mengetahui apa yang berjalan di ANE, Metal, atau CPU, dan model default akan dioptimalkan
Jika butuh model khusus, LoRA mungkin yang terbaik. Ukurannya sekitar 30MB dan tetap mendapat semua keuntungan di atas
Bisa saja dikatakan default harus bisa diganti, tetapi itu lebih dekat ke ideal ala Linux daripada Apple, jadi entah akan benar-benar kita lihat atau tidak. Selain itu ada kekurangan nyata juga. Disengaja atau tidak, prompt biasanya dioptimalkan untuk model target yang dikembangkan, jadi jika model sistem default diganti, kualitas semua aplikasi bisa menurun
https://developer.apple.com/videos/play/wwdc2026/339
Saya jadi bertanya-tanya apakah Apple sedang mendorong pengembang agar memakai LLM melalui lapisan abstraksi API miliknya. Mungkin ini untuk membantu pengembang beralih mulus ketika nanti mereka merilis LLM sendiri
Sepertinya saya pernah dengar bahwa Apple menghabiskan banyak uang untuk pelatihan dan itu entah bagaimana bisa terkait dengan Siri atau Apple AI saat ini. Atau mungkin ini cuma fitur demi kenyamanan pengembang, atau ada maksud lain
Jika Anda peduli pada privasi, ada nilai tambah ketika Apple berada di tengah
Inti framework ini adalah memungkinkan API yang sama menargetkan model bawaan perangkat, model online yang di-host Apple yaitu Private Cloud Computer, atau shim buatan sendiri yang memanggil model online yang di-host secara arbitrer
Dengan begitu, Anda tidak perlu membuat lapisan abstraksi sendiri seperti “yang ini pakai model lokal, yang itu pakai Claude” atau menempelkan integrasi API Anthropic/OpenAI secara langsung; Anda bisa memakai API sistem untuk merutekan panggilan secara dinamis ke berbagai tipe model/penyedia
Ada berbagai kemudahan dan keunikan, seperti mengabstraksikan hal-hal seperti pemanggilan tool di satu tempat, lalu tetap melanjutkan
transcriptyang sama meskipun penyedia atau model diganti secara dinamis di tengah sesiKarena API ini hanya bisa dipakai di perangkat Apple, efeknya juga memecah pasar dan makin mengunci pengguna, karena pengembang tidak bisa memakai sistem yang sama agar aplikasinya berjalan baik di iOS
Tampaknya Apple sedang bersiap untuk saat model on-device mereka menjadi lebih baik, dan itu masuk akal kalau mengingat mereka jadi punya akses ke Gemini
Jika para pengembang menulis semua kode pemanggilan LLM eksternal lewat ini, maka ketika model Apple makin mumpuni dan mencakup lebih banyak use case, perubahannya bisa dilakukan dengan mudah di tiap titik pemanggilan. Itu akan memperbaiki pengalaman pengguna aplikasi dan juga menurunkan biaya tagihan pengembang yang tidak menghasilkan komisi untuk Apple
Apple adalah perusahaan, dan kita semua tahu apa yang dipedulikan perusahaan, jadi kecil kemungkinan ini akan menjadi utopia model lokal yang berjalan di ponsel
Bukan tanpa alasan Microsoft dan Nvidia bekerja sama
Saya penasaran bagaimana ini benar-benar dipakai dalam software yang didistribusikan ke pengguna. Menyuruh pengguna membuat dan memasukkan API key sendiri terasa sebagai hambatan yang terlalu tinggi untuk pengalaman pengguna yang baik
Struktur seperti “membayar uang dengan jumlah yang tidak pasti untuk satu pertanyaan, mungkin tetap tidak mendapat jawaban yang diinginkan, dan kalau ingin memakai lebih banyak harus bayar lagi” tidak menarik bagi kebanyakan orang yang bukan penjudi. Menjelaskan bahwa ucapan “terima kasih” di akhir percakapan panjang bisa mahal karena konteks juga akan lebih sulit diterima oleh pengguna rata-rata
Biaya token yang naik turun seperti yoyo juga tidak membantu. Pengguna umum butuh biaya tetap dan tidak ingin menghabiskan energi untuk terus mengikuti perubahan dunia AI. Masalah seperti “bulan lalu langganan saya bertahan jauh lebih lama” juga bukan arah yang baik
Dalam kebanyakan kasus, menurut saya penilaian Apple bahwa LLM lokal adalah masa depan itu benar
Saya juga masih belum sepenuhnya paham ketentuan Anthropic. Memang ada hal seperti
setup-token Set up a long-lived authentication token (requires Claude subscription)yang bisa dimasukkan, tapi itu terlihat seperti jebakan. Saya tidak tahu siapa yang memakainya, dan rasanya begitu dipakai di mana pun langsung menjadi pelanggaran ketentuanSaat ini di allihat.com, kalau tidak mau memakai key Claude, pengguna bisa memakai model Apple lokal, dan tingkat konversi ke pengguna berbayar naik sekitar 3x lipat. Tapi tentu saja itu bukan pengganti Claude. Saya berharap Apple membuat semacam mekanisme yang bertindak sebagai proksi Claude, supaya saya juga tidak perlu mem-proxy lewat server saya sendiri hanya untuk mengelola pemakaian API Claude
.proxiedApple menyediakan model AI gratis melalui server mereka untuk pengembang dengan kurang dari 2 juta unduhan https://techcrunch.com/2026/06/08/apple-bets-cheaper-ai-will...
Saya paham bahwa kalimat “permintaan pergi langsung dari aplikasi ke Claude API, Apple tidak berada di jalur permintaan, dan tidak melihat prompt maupun respons” itu ditulis dari sudut pandang pengembang
Tapi dari sudut pandang konsumen, itu tetap terasa lucu
Microsoft lebih dulu merusak permainan dengan memasukkan pernyataan di ketentuan Copilot bahwa “Copilot disediakan hanya untuk tujuan hiburan”, lalu juga menambahkan peringatan pada Copilot untuk Excel agar “menghindari penggunaan COPILOT untuk pekerjaan yang membutuhkan akurasi atau reproduksibilitas, atau yang memiliki implikasi hukum, regulasi, atau kepatuhan”
Lalu Apple secara diam-diam menolak ikut arus dengan tidak menginvestasikan miliaran hingga ratusan miliar dolar untuk membuat LLM pesaing. Tentu, mereka tetap menjual ulang Claude atau memanfaatkan Gemini demi orang-orang yang naif, tetapi Apple paham situasinya
https://www.microsoft.com/en-us/microsoft-copilot/for-indivi...
https://support.microsoft.com/en-US/Excel/copilot-function
Agen coding itu sendiri sudah merupakan lapisan yang dipaksakan, dan sekarang kita mau menambah satu lapisan lagi. Agen coding sering terasa seperti vendor manager dari perusahaan outsourcing tahun 90-an
Menjanjikan segalanya kepada pelanggan, lalu menekan kontraktor malang agar tetap mengirimkan hasil. Agen coding juga menghabiskan token 10 kali lebih banyak, seperti selisih antara uang yang ditagihkan perusahaan outsourcing ke pelanggan dan yang dibayarkan ke kontraktor. Uji sederhananya, pekerjaan yang membuat model melewati batas panjang konteks ketika lewat agen coding justru berjalan baik jika diprompt langsung
Lapisan adalah kemewahan, dan ia menghilangkan kendali serta transparansi