- Apple baru saja memperkenalkan model AI vision-language (AFM, Apple Foundation Models) dan framework Foundation Models (API) untuk developer, sambil secara signifikan meningkatkan performa dan efisiensi model on-device maupun cloud
- Model AFM on-device terdiri dari transformer 3B parameter dan vision transformer 300 juta parameter, dengan dukungan input teks dan gambar serta kemampuan multibahasa dan visi, sementara model server menggunakan arsitektur MoE kustom
- Menyediakan fitur kuat dan aksesibilitas developer seperti peringanan model (kuantisasi dan LoRA), dukungan 15 bahasa, pemahaman gambar, penggunaan tool, dan lain-lain
- Model on-device menunjukkan keunggulan dibanding model pesaing pada bahasa Inggris non-AS dan pemahaman gambar, tetapi model server masih kurang dibanding model terbaru seperti GPT-4o
- Perubahan strategi AI Apple dan pengaruhnya di dalam ekosistem iOS menjadi sorotan, termasuk paper Apple yang baru-baru ini memicu kontroversi dan penundaan upgrade AI Siri
Pembaruan besar Apple Foundation Models (AFM)
- Apple telah meningkatkan model AI on-device (tertanam di perangkat mobile) dan model yang di-host di server (AFM), dengan peningkatan besar pada kecepatan, efisiensi, dan performa
- Apple juga menghadirkan API developer (Foundation Models framework) baru, sehingga pemanggilan AI on-device kini dimungkinkan pada perangkat dengan fitur Apple Intelligence yang diaktifkan
Arsitektur dan fitur utama
- Input/output: teks, gambar (maksimum 65.000 token input), output berupa teks
- Arsitektur:
- AFM-on-Device: transformer 3 miliar parameter, vision transformer 300 juta parameter
- AFM-Server: transformer Mixture-of-Experts (MoE) kustom (jumlah parameter tidak diungkap), vision transformer 1 miliar parameter
- Performa: unggul dalam bahasa Inggris non-AS dan pemahaman gambar
- Ketersediaan: AFM-on-Device tersedia melalui Foundation Models framework. AFM-Server tidak tersedia untuk penggunaan publik
- Mendukung 15 bahasa serta penggunaan tool
- Informasi yang tidak diungkap: jumlah parameter model server, batas token, detail dataset pelatihan, dan sebagainya tidak dipublikasikan
Diferensiasi teknis dan optimasi
- Kuantisasi (Quantization):
- Model on-device memampatkan sebagian besar bobot ke 2-bit, sementara embedding layer ke 4-bit (menggunakan quantization-aware training)
- Model server menerapkan ASTC (kompresi untuk grafis), dikompresi ke rata-rata 3,56-bit (embedding 4-bit)
- Adapter LoRA digunakan untuk mengompensasi penurunan performa akibat kompresi, sekaligus menyesuaikan model untuk tugas tertentu seperti peringkasan, koreksi, dan tanya jawab
- Arsitektur MoE kustom meningkatkan efisiensi dengan meminimalkan overhead komunikasi antarperangkat keras
Evaluasi performa
- Model on-device: unggul dibanding model pesaing seperti Qwen2.5-VL-3B dalam bahasa Inggris non-AS dan pemahaman gambar
- Model server: kadang sedikit lebih unggul daripada Qwen3-23B, tetapi masih belum menyamai model terbaru seperti GPT-4o
Kontroversi terbaru dan perubahan strategi AI
- Apple baru-baru ini memicu kontroversi lewat paper yang menguji batas kemampuan penalaran dari lima model AI terbaru, dan paper bantahan pun segera bermunculan
- Upgrade AI Siri ditunda tanpa batas waktu, dan juga telah diajukan gugatan class action terkait minimnya fitur AI pada iPhone terbaru
- Di tengah situasi ketika kubu Google/Android dengan cepat melaju di kompetisi AI, Apple kini sedang mengubah strategi AI-nya lewat Foundation Models dan inisiatif lainnya
Prospek dan dampak ke depan
- Sebagai model bawaan di iOS, ini berpotensi memberi pengaruh sangat besar terhadap ekosistem developer aplikasi
- Karena batasan memori dan kapasitas model, diperkirakan developer aplikasi akan makin banyak memanfaatkan model yang disediakan Apple daripada membundel model AI mereka sendiri
- Strategi Apple menjadikan AI sebagai platform tengah diperhatikan, apakah akan mendorong inovasi aplikasi dan perluasan pemanfaatan AI on-device
Belum ada komentar.