Apple memperbarui besar-besaran model AI on-device dan cloud serta memperkenalkan API developer baru

(deeplearning.ai)

4 poin oleh GN⁺ 2025-06-26 | Belum ada komentar. | Bagikan ke WhatsApp

Apple baru saja memperkenalkan model AI vision-language (AFM, Apple Foundation Models) dan framework Foundation Models (API) untuk developer, sambil secara signifikan meningkatkan performa dan efisiensi model on-device maupun cloud
Model AFM on-device terdiri dari transformer 3B parameter dan vision transformer 300 juta parameter, dengan dukungan input teks dan gambar serta kemampuan multibahasa dan visi, sementara model server menggunakan arsitektur MoE kustom
Menyediakan fitur kuat dan aksesibilitas developer seperti peringanan model (kuantisasi dan LoRA), dukungan 15 bahasa, pemahaman gambar, penggunaan tool, dan lain-lain
Model on-device menunjukkan keunggulan dibanding model pesaing pada bahasa Inggris non-AS dan pemahaman gambar, tetapi model server masih kurang dibanding model terbaru seperti GPT-4o
Perubahan strategi AI Apple dan pengaruhnya di dalam ekosistem iOS menjadi sorotan, termasuk paper Apple yang baru-baru ini memicu kontroversi dan penundaan upgrade AI Siri

Pembaruan besar Apple Foundation Models (AFM)

Apple telah meningkatkan model AI on-device (tertanam di perangkat mobile) dan model yang di-host di server (AFM), dengan peningkatan besar pada kecepatan, efisiensi, dan performa
Apple juga menghadirkan API developer (Foundation Models framework) baru, sehingga pemanggilan AI on-device kini dimungkinkan pada perangkat dengan fitur Apple Intelligence yang diaktifkan

Input/output: teks, gambar (maksimum 65.000 token input), output berupa teks
Arsitektur:
- AFM-on-Device: transformer 3 miliar parameter, vision transformer 300 juta parameter
- AFM-Server: transformer Mixture-of-Experts (MoE) kustom (jumlah parameter tidak diungkap), vision transformer 1 miliar parameter
Performa: unggul dalam bahasa Inggris non-AS dan pemahaman gambar
Ketersediaan: AFM-on-Device tersedia melalui Foundation Models framework. AFM-Server tidak tersedia untuk penggunaan publik
Mendukung 15 bahasa serta penggunaan tool
Informasi yang tidak diungkap: jumlah parameter model server, batas token, detail dataset pelatihan, dan sebagainya tidak dipublikasikan

Kuantisasi (Quantization):
- Model on-device memampatkan sebagian besar bobot ke 2-bit, sementara embedding layer ke 4-bit (menggunakan quantization-aware training)
- Model server menerapkan ASTC (kompresi untuk grafis), dikompresi ke rata-rata 3,56-bit (embedding 4-bit)
Adapter LoRA digunakan untuk mengompensasi penurunan performa akibat kompresi, sekaligus menyesuaikan model untuk tugas tertentu seperti peringkasan, koreksi, dan tanya jawab
Arsitektur MoE kustom meningkatkan efisiensi dengan meminimalkan overhead komunikasi antarperangkat keras

Model on-device: unggul dibanding model pesaing seperti Qwen2.5-VL-3B dalam bahasa Inggris non-AS dan pemahaman gambar
Model server: kadang sedikit lebih unggul daripada Qwen3-23B, tetapi masih belum menyamai model terbaru seperti GPT-4o

Apple baru-baru ini memicu kontroversi lewat paper yang menguji batas kemampuan penalaran dari lima model AI terbaru, dan paper bantahan pun segera bermunculan
Upgrade AI Siri ditunda tanpa batas waktu, dan juga telah diajukan gugatan class action terkait minimnya fitur AI pada iPhone terbaru
Di tengah situasi ketika kubu Google/Android dengan cepat melaju di kompetisi AI, Apple kini sedang mengubah strategi AI-nya lewat Foundation Models dan inisiatif lainnya

Sebagai model bawaan di iOS, ini berpotensi memberi pengaruh sangat besar terhadap ekosistem developer aplikasi
Karena batasan memori dan kapasitas model, diperkirakan developer aplikasi akan makin banyak memanfaatkan model yang disediakan Apple daripada membundel model AI mereka sendiri
Strategi Apple menjadikan AI sebagai platform tengah diperhatikan, apakah akan mendorong inovasi aplikasi dan perluasan pemanfaatan AI on-device