1 poin oleh GN⁺ 2024-06-11 | 1 komentar | Bagikan ke WhatsApp
  • Apple memperkenalkan Apple Intelligence, yang menggabungkan model generatif dengan konteks pribadi, menghadirkan pembuatan bahasa dan gambar serta eksekusi tugas lintas aplikasi ke pengalaman dasar di iPhone, iPad, dan Mac
  • iOS 18, iPadOS 18, dan macOS Sequoia mengintegrasikan Writing Tools, prioritas dan ringkasan di Mail, ringkasan notifikasi, serta fitur perekaman, transkripsi, dan ringkasan audio di Notes dan Phone
  • Area gambar diperluas dengan Image Playground, Genmoji, pencarian Photos, Clean Up, dan Memories, serta dapat digunakan di aplikasi Apple dan aplikasi pihak ketiga yang mengadopsi API
  • Siri diperluas untuk menangani input teks, pemahaman layar, ratusan tugas di dalam dan di luar aplikasi, jawaban tentang cara menggunakan perangkat, hingga pemrosesan permintaan berbasis informasi on-device
  • Perlindungan privasi berpusat pada pemrosesan on-device dan Private Cloud Compute; ChatGPT terintegrasi ke Siri dan Writing Tools berbasis GPT-4o setelah izin pengguna, dan versi beta akan tersedia musim gugur ini dalam bahasa Inggris AS

Struktur dasar Apple Intelligence

  • Apple Intelligence adalah sistem kecerdasan personal untuk iPhone, iPad, dan Mac, yang menggabungkan kemampuan model generatif dengan konteks pribadi pengguna
  • Terintegrasi secara mendalam ke iOS 18, iPadOS 18, dan macOS Sequoia, serta memanfaatkan Apple silicon untuk melakukan tugas berikut
    • Memahami dan menghasilkan bahasa serta gambar
    • Menjalankan tugas lintas aplikasi
    • Menyederhanakan dan mempercepat pekerjaan sehari-hari berdasarkan konteks pribadi
  • Untuk permintaan yang lebih kompleks, Private Cloud Compute menyesuaikan kapasitas komputasi yang dibutuhkan antara pemrosesan on-device dan model berbasis server Apple silicon

Pemahaman bahasa dan alat penulisan

  • Writing Tools yang hadir di seluruh sistem diterapkan di hampir semua tempat penulisan di iOS 18, iPadOS 18, dan macOS Sequoia, termasuk Mail, Notes, Pages, dan aplikasi pihak ketiga
  • Fitur bantuan penulisan berfokus pada penyempurnaan draf agar sesuai dengan tujuan dan format tulisan
    • Rewrite: Mengusulkan beberapa versi tulisan yang sudah dibuat dan menyesuaikan nada dengan audiens serta tugas
    • Proofread: Memeriksa tata bahasa, pilihan kata, dan struktur kalimat, serta memberikan saran perbaikan dan penjelasan
    • Summarize: Meringkas teks yang dipilih dalam bentuk paragraf, butir inti, tabel, atau daftar
  • Mail menambahkan Priority Messages yang menampilkan email mendesak di bagian atas kotak masuk
    • Ringkasan dapat dilihat tanpa membuka email
    • Thread panjang dapat menampilkan detail terkait dengan satu ketukan
    • Smart Reply menyarankan balasan cepat dan membantu mengidentifikasi pertanyaan dalam email agar semuanya terjawab
  • Notifikasi menerapkan Priority Notifications dan fitur ringkasan untuk mengurangi informasi yang harus dinilai dari layar kunci
    • Menampilkan notifikasi penting di bagian atas tumpukan
    • Menampilkan inti notifikasi panjang atau notifikasi yang menumpuk di layar kunci
    • Focus baru bernama Reduce Interruptions hanya menampilkan notifikasi yang mungkin memerlukan perhatian segera
  • Di aplikasi Notes dan Phone, audio dapat direkam, ditranskripsi, dan diringkas
    • Saat perekaman dimulai selama panggilan, peserta akan diberi tahu secara otomatis
    • Setelah panggilan berakhir, Apple Intelligence merangkum poin-poin utamanya

Pembuatan gambar dan fitur ekspresi

  • Image Playground adalah fitur yang memungkinkan pengguna membuat gambar dalam hitungan detik, dengan tiga gaya: Animation, Illustration, dan Sketch
  • Dapat digunakan langsung di dalam aplikasi seperti Messages, dan juga tersedia sebagai aplikasi terpisah
    • Semua gambar dibuat secara on-device
    • Pengguna dapat memilih konsep dari kategori seperti tema, kostum, aksesori, dan lokasi
    • Pengguna dapat memasukkan deskripsi untuk mendefinisikan gambar
    • Orang dari pustaka foto pribadi dapat disertakan dalam gambar
  • Di Messages, konsep rekomendasi yang dipersonalisasi terkait percakapan akan ditampilkan
    • Misalnya, dalam percakapan grup yang sedang merencanakan hiking, konsep terkait teman, tujuan, dan aktivitas akan direkomendasikan
  • Di Notes, Image Playground dapat digunakan melalui Image Wand pada palet alat Apple Pencil
    • Sketsa kasar dapat diubah menjadi gambar
    • Jika ruang kosong dipilih, gambar dapat dibuat menggunakan konteks di sekitarnya
  • Image Playground juga tersedia di Keynote, Freeform, dan Pages, serta dapat digunakan di aplikasi pihak ketiga yang mengadopsi Image Playground API baru

Genmoji dan fitur Photos

  • Genmoji adalah fitur untuk membuat gambar berbentuk emoji baru dengan memasukkan deskripsi
    • Saat deskripsi dimasukkan, Genmoji dan opsi tambahan akan ditampilkan
    • Genmoji teman atau keluarga dapat dibuat berdasarkan foto
    • Dapat ditambahkan secara inline di pesan atau dibagikan sebagai stiker dan reaksi Tapback
  • Pencarian Photos mendukung bahasa alami sehingga adegan spesifik dapat ditemukan dengan lebih langsung
    • Pencarian foto spesifik seperti “Maya skateboarding in a tie-dye shirt” dimungkinkan
    • Pencarian video dapat menemukan momen tertentu dalam klip dan langsung berpindah ke bagian terkait
  • Alat Clean Up baru mengidentifikasi dan menghapus elemen yang mengganggu di latar belakang foto
    • Dirancang agar tidak mengubah subjek secara tidak sengaja
  • Di Memories, saat pengguna memasukkan deskripsi, Apple Intelligence memilih foto dan video, menyusun alur cerita dengan bab berbasis tema, lalu merangkainya menjadi film
    • Apple Music juga menyediakan rekomendasi lagu yang sesuai untuk memori tersebut
    • Foto dan video pengguna tetap privat di perangkat dan tidak dibagikan kepada Apple atau orang lain

Perubahan pada Siri

  • Siri terintegrasi lebih dalam ke pengalaman sistem berbasis Apple Intelligence
  • Kemampuan pemahaman bahasanya diperkuat sehingga dapat mengikuti pengguna meski ucapannya tersendat dan mempertahankan konteks antarpermintaan
  • Pengguna dapat mengetik ke Siri, serta beralih antara teks dan suara sesuai situasi
  • Saat Siri aktif, desain efek cahaya baru yang mengelilingi tepi layar akan ditampilkan
  • Siri juga dapat menjawab ribuan pertanyaan tentang cara menggunakan iPhone, iPad, dan Mac
    • Menjadwalkan email di aplikasi Mail
    • Menangani pertanyaan seperti beralih dari Light Mode ke Dark Mode
  • Melalui pemahaman layar, Siri dapat melakukan tugas yang terhubung dengan informasi di layar saat ini
    • Alamat baru yang diterima di Messages dapat ditambahkan ke kartu kontak
  • Siri menjalankan ratusan tugas baru di dalam dan di luar aplikasi Apple maupun pihak ketiga
    • Memunculkan artikel tertentu dari Reading List
    • Menangani permintaan seperti mengirim foto barbeku hari Sabtu kepada orang tertentu
  • Siri juga menangani permintaan yang dipersonalisasi berdasarkan informasi on-device pengguna
    • Menemukan dan memutar podcast yang direkomendasikan meski pengguna tidak ingat apakah melihatnya lewat pesan teks atau email
    • Mencari informasi penerbangan dan mencocokkannya dengan pelacakan penerbangan real-time untuk memberi tahu waktu kedatangan

Perlindungan privasi dan Private Cloud Compute

  • Apple Intelligence dirancang dengan asumsi memahami konteks pribadi sekaligus melindungi privasi pengguna
  • Banyak model berjalan sepenuhnya secara on-device
  • Untuk permintaan kompleks yang membutuhkan kemampuan pemrosesan lebih besar, Private Cloud Compute digunakan
    • Model server yang lebih besar berjalan di server berbasis Apple silicon
    • Dirancang agar data tidak disimpan atau terekspos
  • Pakar independen dapat memeriksa kode yang berjalan di server Apple silicon untuk memverifikasi perlindungan privasi
  • Private Cloud Compute secara kriptografis menjamin bahwa iPhone, iPad, dan Mac hanya berkomunikasi dengan server yang menjalankan perangkat lunak yang dicatat secara publik dan dapat diperiksa

Integrasi ChatGPT

  • Apple mengintegrasikan akses ChatGPT ke dalam pengalaman iOS 18, iPadOS 18, dan macOS Sequoia
  • Pengguna dapat menggunakan keahlian, pemahaman gambar, dan pemahaman dokumen ChatGPT tanpa berpindah ke alat terpisah
  • Siri dapat memanfaatkan ChatGPT saat bermanfaat
    • Siri meminta izin pengguna sebelum mengirim pertanyaan, dokumen, atau foto ke ChatGPT
    • Setelah diizinkan, Siri menampilkan jawaban secara langsung
  • ChatGPT juga tersedia di Writing Tools di seluruh sistem
    • Melalui Compose, pengguna dapat membuat konten yang sedang ditulis
    • Dengan alat gambar ChatGPT, pengguna dapat membuat gambar dalam berbagai gaya untuk melengkapi tulisan
  • Penggunaan ChatGPT mencakup perlindungan privasi
    • Alamat IP disembunyikan
    • OpenAI tidak menyimpan permintaan
    • Jika pengguna menghubungkan akun, kebijakan penggunaan data ChatGPT akan berlaku
  • Integrasi ChatGPT akan tersedia di iOS 18, iPadOS 18, dan macOS Sequoia akhir tahun ini, dan berbasis GPT-4o
    • Dapat diakses gratis tanpa membuat akun
    • Pelanggan ChatGPT dapat menghubungkan akun untuk menggunakan fitur berbayar

Jadwal ketersediaan dan perangkat yang didukung

  • Apple Intelligence akan tersedia gratis bagi pengguna
  • Akan tersedia sebagai beta pada musim gugur ini di iOS 18, iPadOS 18, dan macOS Sequoia, dengan bahasa awal Inggris AS
  • Beberapa fitur, platform perangkat lunak, dan bahasa tambahan akan tersedia sepanjang tahun berikutnya
  • Perangkat yang didukung adalah sebagai berikut
    • iPhone 15 Pro
    • iPhone 15 Pro Max
    • iPad dan Mac dengan chip M1 atau lebih baru
  • Siri dan bahasa perangkat harus diatur ke Inggris AS agar dapat digunakan
  • Informasi tambahan tersedia di apple.com/apple-intelligence

1 komentar

 
GN⁺ 2024-06-11
Opini Hacker News
  • Fitur AI personal yang ditunjukkan Apple hari ini benar-benar mengesankan
    Ini menunjukkan bahwa kekuatan nyata AI untuk konsumen ada pada pemilik platform yang sudah memegang sebagian besar kehidupan digital kita seperti pesan, email, foto, dan aplikasi—yakni Apple atau Google, serta Microsoft di ranah kerja/kehidupan
    Cara Siri melakukan tugas seperti kalender, reservasi, dan pengecekan penerbangan berdasarkan konteks email dan pesan terlihat sangat berguna. Saya memang mengira fitur kecerdasan personal suatu hari akan datang, tetapi tidak menyangka Apple akan menyerang sekuat ini, dan efek menarik orang ke dalam ekosistemnya sangat besar
    Bagus juga bahwa mereka mempertimbangkan private cloud, integrasi ChatGPT, playground pembuatan gambar, hingga Genmoji, dan tampaknya bisa menjadi fitur “untuk kita semua” seperti yang dikatakan Craig. Namun pembuatan gambar orang nyata terlalu dekat dengan uncanny valley, jadi rasanya tidak akan menyenangkan menerima gambar ucapan ulang tahun yang dingin dan terkesan asal-asalan seperti itu

    • Ini adalah keuntungan dari cara Apple menangani kepemilikan produk, dan kontras dengan Google atau Microsoft
      Konvergensi AI sepertinya akan mengekspos cacat organisasi jauh lebih terang-terangan dibanding perubahan teknologi sebelumnya. Tidak ada yang menginginkan AI generatif yang hanya berfungsi di Gmail, atau AI lain yang hanya berfungsi di Messages; orang menginginkan fitur platform yang bekerja di semua tempat mereka menulis teks
      Saat ini saya tidak terlalu yakin Google atau Microsoft secara organisasi bisa menyediakan hal seperti itu
    • Masih terlalu dini untuk menilai, dan jangan terlalu mudah termakan marketing
    • Apple Intelligence sepertinya akan sukses besar. iOS jelas merupakan platform yang tepat untuk menggabungkan pengalaman pengguna yang baik dengan AI, dan dengan menempelkan large language model ke Siri, tim Siri mendapat kesempatan untuk cepat menebus dosa-dosa masa lalu
      Private computing juga tampak sangat penting. Selain penggunaan yang obvious untuk memproses komputasi berat di server cloud, ini juga bisa menjadi jalan menuju interpreter kode personal—yakni scripting yang layak di iOS—dan dalam jangka panjang memungkinkan pengembangan di iPadOS
      Fakta bahwa Apple juga memakai chip sendiri di server juga penting. Pertanyaannya bukan “apakah cukup”, melainkan apa yang akan mereka lakukan untuk menaikkannya ke level NVIDIA dari sisi developer dan hardware
      Sepertinya orang-orang belum memahami gambaran besarnya karena hanya melihat bahwa Apple harus ikut bersaing dalam model tercanggih. Sekarang saya paham headline bahwa Nadella mengkhawatirkan kemitraan Apple dan OpenAI
    • Banyak yang ditunjukkan cukup mengesankan, dan terlihat seperti benar-benar mewujudkan janji asisten digital personal yang selama puluhan tahun diusung perangkat komputasi personal
      Pertanyaan terpentingnya adalah reliabilitas. Intinya apakah ini bekerja dengan benar setiap kali, atau berpotensi salah memahami isi secara parah dan mempermalukan pengguna yang memercayakannya
    • Dalam konteks pemrosesan di luar perangkat, perlu juga diingat bahwa cakupan dan pengaruh hukum pengawasan AS belakangan ini telah meluas
      https://www.theguardian.com/us-news/2024/apr/16/house-fisa-g...
  • Selain peningkatan pencarian dan Siri, saya tidak yakin seberapa berguna fitur generatif yang Apple usulkan di sini
    Jika seseorang menghabiskan satu jam menggambar sesuatu untuk ulang tahun orang lain lalu mengirimkannya, sebagian besar nilai yang dirasakan penerima bukan terletak pada kualitas gambarnya, melainkan pada fakta bahwa orang itu mencurahkan usaha dan waktu sebanyak itu untuk membuat hasil yang unik khusus bagi mereka. Perbedaan kepuasan antara memakai sesuatu yang dibuat sendiri dan sesuatu yang dibeli juga mirip
    Gambar AI yang dibuat Tania dalam beberapa detik mungkin awalnya menyenangkan, tetapi sepertinya akan cepat menjadi spam yang memenuhi layar percakapan dan tidak menambahkan apa-apa. Hal yang sama berlaku untuk membuatkan anak cerita pengantar tidur dengan anak itu sebagai tokoh utama
    Di dunia tempat kita bisa memiliki apa saja, nilai segala sesuatu menjadi 0

    • Saya sudah membuat semesta cerita yang cukup rumit dan detail bersama anak saya, selalu dimulai dengan cara yang sama dan memiliki karakter-karakter yang dikenal
      Kemarin saat menyetir untuk membeli burrito, saya mendiktekan poin-poin detail ke gpt-4o, termasuk seluruh pembuka cerita, lalu memintanya menceritakan petualangan baru berdasarkan konteks itu, dan hasilnya sangat bagus. Saya bisa melihat reaksi anak saya di pantulan cermin, dan itu tidak merusak apa yang sudah kami bangun. Justru memberi saya ide baru untuk dipakai saat bercerita sendiri
      Jika mengandalkan AI generatif tanpa kontribusi personal dan kreatif sendiri, hasilnya tidak akan menarik, tetapi jika AI generatif diletakkan di atas sesuatu yang terus dibuat dan dibangun, hasilnya bisa sangat luar biasa
      Dalam arti ini, AI generatif terasa seperti alat tambahan lain yang semakin baik digunakan semakin banyak dilatih, seperti ketika kita tidak hanya memakai piano atau organ, tetapi juga mendapat synthesizer
    • Hal yang sama bisa dikatakan tentang mengirim SMS ucapan ulang tahun dibanding mengirim surat atau kartu tulisan tangan
      Sekarang pun tidak ada yang menghalangi kita mengirim kartu tulisan tangan, dan tentu saja itu akan lebih diapresiasi, tetapi orang-orang juga menghargai SMS. Terutama jika berjauhan atau hubungannya tidak terlalu mendalam
    • Nilai hadiah tidak hanya bergantung pada usaha atau uang yang dikeluarkan. Jika memilih sesuatu yang bagus, ada nilai dalam memilih dengan tepat
      Semakin mudah memberi hadiah itu sendiri, konteks akan semakin penting
    • Saya rasa logika yang sama berlaku saat membeli kartu dari Hallmark
    • Sebagai orang yang setiap hari menerima banyak gambar ucapan “selamat pagi” dari orang-orang tersayang, saya benar-benar memahami perasaan ini
      Menarik untuk melihat apakah spam AI, terutama emoji dan stiker yang dipersonalisasi, akan digunakan ulang atau justru disebar seperti plastik sekali pakai
  • Demonya terasa seperti gambaran AI yang dulu dibayangkan sebelum ChatGPT muncul. Dipersonalisasi, memahami konteks, dan merupakan cara interaksi yang terintegrasi mendalam ke seluruh sistem
    Penjelasan tentang menangani pekerjaan AI yang membutuhkan server sambil tetap menjaga permintaan seprivat mungkin juga bagus. Kalau itu perangkat lunak server yang berjalan di hardware Apple dan bisa diaudit, rasanya hampir menjadi opsi terbaik untuk pekerjaan seperti itu; akan lebih baik lagi kalau open source
    Demo ketika Siri memahami konteks tentang “ibu” berdasarkan isi email yang dikirim ibu adalah persis adegan yang kita bayangkan di dunia AI. Kemampuan AI murni dari model itu sendiri kemungkinan besar suatu saat akan menjadi komoditas umum, dan kini yang penting adalah integrasi menyeluruh hardware dan sistem yang memanfaatkan model itu
    Pengalaman setelah benar-benar dirilis adalah soal lain, tetapi dari visinya saja sudah mengesankan, dan Apple sekali lagi memahami pengalaman pengguna. Implikasi pengumuman ini bisa jauh lebih besar daripada yang terlihat, dan khususnya ada harapan bahwa ini dapat membuat komputasi lebih mudah bagi kalangan lansia

    • Kita tidak akan tahu seberapa bagus fitur-fitur ini sampai berada di tangan para reviewer
      Demo AI yang “bisa melakukan segala macam hal” mudah dibuat terlihat keren, tetapi kalau sering runtuh di dunia nyata, pada akhirnya ia menjadi Siri saat ini. Kita perlu mengingat iklan dari 12 tahun lalu ini: https://www.youtube.com/watch?v=sw1iwC7Zh24
      Dari hal-hal yang dijanjikan saat itu, masih banyak yang sampai sekarang sulit dipercayakan kepada Siri
    • Sepertinya terlalu banyak orang berasumsi bahwa karena ChatGPT adalah antarmuka percakapan, AI juga harus dirancang seperti itu. Itu mirip dengan menganggap komputer akan selalu berupa command line
      Apple menyediakan antarmuka grafis yang cukup baik untuk fitur AI sesuai tujuan masing-masing, dan akan menarik melihat prosesnya makin mendalam ke depan
    • Fitur seperti Siri memahami isi tentang ibu di dalam email, terus terang, semuanya terasa terlalu menyeramkan
    • Jika fitur ini bekerja seperti yang didemokan, ini akan menarik orang lebih dalam ke dalam ekosistem
      Kita akan ingin ia memahami hidup kita, dan karena semua perangkat harus bisa membangun konteks kita agar dapat menjawab peristiwa atau berbagai pertanyaan, itu bisa berujung pada pikiran seperti “apakah saya harus membeli Apple TV alih-alih Chromecast supaya Siri juga tahu program yang saya tonton?”
    • Pada akhirnya saya tidak suka karena sepertinya ini akan membuat moat makin besar dan platform lock-in makin menyakitkan
      Harga iPhone terus naik, dan komputasi berperforma tinggi setelah masuk terlalu dalam ke ekosistem ini pada dasarnya bisa terasa seperti pemerasan. Karena meninggalkan dunia Apple akan menjadi hampir mustahil
      Para pesaing juga tidak memiliki sistem yang terintegrasi seperti ini, sehingga akan sulit mengintegrasikan semuanya pada level yang sama
  • Dari sudut pandang branding, ini sempurna. Sesuatu yang tampak “kecil” seperti huruf dalam nama perusahaan bisa berdampak besar puluhan tahun kemudian
    Mereka bisa membawa AI == Apple Intelligence, dan “AI for the rest of us” di bagian akhir menangkap momen ini dengan baik sekaligus seolah mengisyaratkan ke mana Apple akan bergerak
    Apple tampaknya akan membangun keahlian dalam menangani skala raksasa penggunaan oleh pengguna yang lebih kasual untuk membuat gambar kreatif atau lucu, emoji, pekerjaan teks, dan peningkatan kualitas hidup. Meski tidak selalu berada di garis terdepan teknologi AI baru lalu langsung mengintegrasikannya ke fitur pengguna, untuk mendukung skala unik ini mereka harus mendekati garis terdepan teknologi yang sama
    WWDC kali ini mengesankan, dan saya penasaran karena tidak ada kabar tentang Mac Studio, Mac Pro, M3 Ultra, M4 Ultra, maupun M3/M4 Extreme. Saya menduga mereka akan memakai M2 Ultra buatan sendiri dan sejenisnya untuk kapasitas komputasi cloud, dan menarik karena itu memang disebutkan; saya penasaran apakah detail lebih lanjut tentang sisi ini akan muncul

    • Menurut saya pengumuman terbesar adalah private compute cloud berbasis Apple Silicon. Apple sedang membangun keahlian internal yang akan mengincar NVIDIA
    • Apa yang dilakukan Apple di sini cerdas, tetapi juga bisa menimbulkan kebingungan
      Di satu sisi seolah mereka mengatakan “kami memiliki ini”, tetapi di sisi lain mereka menumpangkan brand yang berada di luar kendali mereka. Semoga orang-orang tidak menyingkatnya menjadi ApI. Kalau begitu, hasil pencarian API akan tercemar
    • Rasanya seperti mendapat remah-remah untuk pengumuman hardware masa depan. Misalnya bisa saja nanti muncul kalimat seperti “kami dengan senang hati mengumumkan M4 Ultra, prosesor terbaru yang sangat kuat dan sudah kami gunakan di private AI cloud”
    • Membuat inisial produk tidak bisa dipakai dan tidak bisa dicari adalah langkah yang benar-benar cerdas. Apple berhasil lagi
  • Saya skeptis sampai melihatnya benar-benar bekerja
    Di satu sisi Apple memiliki rekam jejak yang baik dalam perlindungan privasi dan pemrosesan di perangkat, tetapi pengumuman kali ini punya terlalu banyak bagian yang kabur. Tidak jelas berdasarkan kriteria apa sesuatu dijalankan di cloud, bagaimana model pribadi digunakan di beberapa perangkat, apakah itu berarti model tersebut sementara dipindahkan ke cloud, dan bagaimana perbedaannya dalam mode tamu
    Bahkan ungkapan “OpenAI tidak menyimpan permintaan” terasa sengaja dibuat tidak transparan. Saya sempat berharap ada pendekatan seperti federated learning yang memakai beberapa perangkat Apple bersama-sama untuk memproses permintaan, tetapi tampaknya pisau cukur Occam akhirnya menang, jadi kita lihat saja nanti

    • Apple juga punya sejarah panjang dengan “kamu memegangnya dengan cara yang salah”. Saya tidak mengharapkan asisten AI yang menakjubkan, melainkan sesuatu yang sesekali menebak maksud pengguna dengan benar
    • Agar adil, ini adalah keynote, dan detailnya akan diungkap dalam sesi-sesi
    • Mereka terlalu sering mengulang klaim “rekam jejak privasinya baik” sampai membuatnya terasa seperti fakta
    • Tampaknya masih banyak pekerjaan yang harus dilakukan dalam beberapa bulan ke depan, dan sebagian fitur mungkin saja tertunda
      Di beta kita akan melihat bagaimana kata-kata Apple benar-benar diimplementasikan, tetapi saya akan menjauh dari beta. Agak disayangkan, tetapi untuk saat ini ketidakjelasan justru menguntungkan Apple. Lebih baik berjanji lebih sedikit lalu memberikan lebih banyak daripada berjanji berlebihan lalu memberikan kurang
    • Mereka harus menyediakan mekanisme agar pengguna bisa melihat data yang diunggah
  • Jika pemahaman saya benar, ada tiga hal: 1) AI di dalam perangkat, 2) AI yang memakai server Apple, 3) AI yang memakai layanan ChatGPT/OpenAI atau layanan lain di masa depan
    Nomor 1 tampaknya akan beralih ke nomor 2 jika dinilai membutuhkan kemampuan pemrosesan tambahan, dan nomor 3 sepertinya hanya dipanggil jika ada izin eksplisit dari pengguna
    Seperti disinggung di bawah, penyedia lain juga akan ditambahkan nanti

    • Menurut saya tidak ada perbedaan praktis antara nomor 2 dan 3. Begitu data meninggalkan perangkat, data itu sudah pergi, dan tidak bisa ditarik kembali maupun dikendalikan
    • Tahap 3 tampaknya akan mendukung model dan penyedia lain di kemudian hari
      Akan bagus jika mendukung semua server yang memiliki API standar sederhana, sehingga bisa menjalankan Llama 3 yang di-host sendiri atau sesuatu yang akan muncul dalam 6–12 bulan ke depan
    • Nomor 3 terdengar ditujukan untuk penggunaan yang tidak bersifat personal. Pada dasarnya ini fungsi bergaya mesin pencari
      Sepertinya dipakai ketika ingin mencari catatan atau informasi olahraga, film beserta informasinya, dan semacamnya
    • Masalahnya, Apple tidak menjelaskan kapan nomor 1 bisa beralih ke nomor 2, dan apakah itu bisa dimatikan sepenuhnya dengan sangat jelas
      Sejauh yang saya tahu, nomor 1 bisa saja beralih ke nomor 2 ketika pemerintah meminta data pribadi atau ketika model iklan Apple membutuhkan detail sensitif untuk personalisasi
    • Saya juga memahaminya begitu. Saya berharap mereka lebih memperjelas di mana batas antara nomor 1 dan 2, tetapi begitu benar-benar sampai ke tangan pengguna, para YouTuber pasti akan segera menguliknya secara mendalam
  • Seperti yang saya katakan di thread lain, cukup mengganggu bahwa pembuatan gambar dimasukkan dan mendapat perhatian sebesar itu
    Saya khawatir soal keandalannya jika orang jadi percaya pada informasi penting tanpa memeriksa sumbernya; misalnya untuk hal seperti penerbangan, itu bisa berujung pada situasi buruk
    Meski begitu, tingkat kematangan fitur-fitur ini dan kegunaan praktisnya menarik. Mungkin bukan yang paling mencolok, tetapi hal-hal yang ditunjukkan memang berguna dalam praktik. Saya juga suka bahwa ChatGPT menjadi opsi setiap kali Siri menilai itu berguna
    Pertanyaan terbesar adalah apakah komponen online bisa dimatikan, dan apa yang terjadi jika sesuatu tidak bisa diproses secara lokal. Dari penjelasan bahwa server memakai chip yang sama, saya juga penasaran apakah modelnya memang tidak bisa berjalan lokal, atau karena konteksnya
    Juga tidak begitu jelas apakah ini berlaku per fitur secara keseluruhan atau per sebagian permintaan, dan mungkin ini berarti tingkat pemrosesan lokal dan cloud akan berbeda-beda menurut perangkat keras seiring waktu

    • Terkait pembuatan gambar, Image Playground tampaknya mendukung tiga gaya: Animation, Illustration, dan Sketch
      Ada sesuatu yang tidak ada. Tidak ada gaya fotorealistis
      Ini terlihat seperti pilihan yang bagus. Saya tidak terlalu suka gagasan mengubah semuanya menjadi lebih banyak meme dan emoji bergaya kartun, tetapi setidaknya itu jelas dibuat-buat dan mengarah ke sisi “hiburan”. Anak-anak akan menyukainya, dan orang dewasa juga mungkin menyukainya
      Orang-orang tetap bisa membuat sesuatu yang sangat tidak pantas sehingga pasti ada kontroversi, tetapi tingkat risikonya lebih rendah
    • Sepertinya konteks asal informasi juga ditampilkan bersama jawabannya. Misalnya pesan, acara, dan materi lain
      Jadi kita bisa cepat memeriksa apakah jawabannya benar. Ini mirip pencarian berbasis makna, tetapi hasilnya dijelaskan dalam teks yang lebih fleksibel
    • Saya rasa seiring waktu, tingkat pemrosesan lokal dan cloud kemungkinan besar akan berbeda-beda menurut perangkat
      Apple menambahkan server sebagai solusi sementara karena kebutuhan, tetapi kondisi idealnya adalah suatu titik ketika semua perangkat yang mereka jual bisa menjalankan semuanya secara lokal selama periode yang cukup lama, lalu mereka bisa mematikan server
    • Selama dua tahun ke depan, saat Apple mencari cara untuk mengendalikannya, saya khawatir remaja akan punya kemampuan tak terbatas untuk melewati guardrail dan membuat gambar yang tidak pantas untuk sekolah
    • Apple menyembunyikan jalan memutar ini. Pertama-tama tersedia dalam bahasa Inggris AS, lalu menyusul ke wilayah lain selama setahun berikutnya
      Ini bisa saja tidak pernah benar-benar datang. Model bahasa besar cepat gagal begitu bergerak menjauh dari bahasa yang kaya sumber daya
  • Ini terlihat sangat keren
    Mereka mengatakan modelnya bisa diperluas ke private cloud compute berbasis Apple Silicon, dan perangkat pengguna akan memastikan eksekusi “publicly verifiable software” untuk mencegah penyalahgunaan data
    Saya penasaran apakah kode sisi server akan menjadi open source. Jika iya, itu akan menjadi kejutan positif. Saya penasaran bagaimana ini akan berkembang ke depan
    Jika bekerja seperti yang diiklankan, ini rasanya langsung jadi momen “diam dan ambil uang saya”. Siri akhirnya tampak menjadi seperti yang seharusnya sejak awal, dan saya juga penasaran apakah mereka memperluas cakupan hal yang bisa dilakukan sejak awal dengan menumpangkannya di atas katalog Shortcuts Actions
    Fitur pembuatan gambar dan emoji yang terintegrasi dengan Apple Photos dan bagian lain dari sistem juga terlihat sangat keren. Mac/iPad tampaknya membutuhkan M1 atau lebih baru, sementara iPhone membutuhkan 15 Pro

    • Tidak harus membeli perangkat baru. Karena kompatibel mundur dengan A17 Pro serta M1, M2, M3, dan M4
      Integrasi layanan memakai model yang sudah ada, dan terasa seperti memperluas API yang berakar dari AppleScript ke model bahasa besar atau sistem keluarga Stable Diffusion. Namun karena dorongan game dan cloud, mereka tampaknya ingin mendorong M4 secepat mungkin
    • Bagi yang penasaran, memang ada integrasi ChatGPT
      Caranya, jika model di perangkat menilai “ini bisa dijawab lebih baik oleh ChatGPT”, pengguna akan ditanya apakah ingin menggunakannya. Dari penjelasannya, sepertinya arsitekturnya memungkinkan model lain dipasang seiring waktu
      Khususnya ChatGPT 4o bisa digunakan gratis tanpa perlu membuat akun OpenAI
    • Bagian ini benar-benar membuat saya penasaran. Mereka membungkusnya sebagai “menjalankan model bahasa besar di cloud”, tetapi bagi saya justru terasa seperti inti masalahnya disembunyikan
      Apakah ini berarti klien secara umum bisa memverifikasi secara kriptografis kode yang sedang berjalan di server? Jika ya, itu sangat menarik dan berguna bahkan di luar penggunaan ini
    • Melihat integrasi ChatGPT tampak seperti panggilan API, ini terasa seperti lapisan orkestrasi yang berjalan di Apple Silicon
      Tidak jelas apa persisnya yang dihitung dalam “private cloud compute”
  • Bagian yang bertanya, “Bolehkah saya menggunakan ChatGPT untuk tugas ini?” terasa sangat kaku dan tidak seperti Apple
    Ini ungkapan lama, tetapi rasanya Steve Jobs akan berguling di kuburnya. Jujur saya bingung kenapa itu perlu
    Apakah mereka tidak berhasil membuat integrasi yang cukup konsisten? Kalau begitu, apakah artinya bagian lainnya tidak berbasis ChatGPT? Apa bedanya? Dari sudut pandang pengguna, ini cukup membingungkan

    • Menurut saya itu pilihan paling cerdas dan realistis dalam presentasi tersebut
      Menjadi yang terbaik dalam AI di perangkat adalah peluang pasar yang sangat besar. Mencoba melakukan semuanya sendiri sama bodohnya seperti meluncurkan Safari tanpa kemitraan halaman utama Google Search
      Apple bisa berfokus pada kekuatannya sendiri: pemrosesan di perangkat dan meleburkan AI ke dalam pengalaman pengguna di seluruh platform, tanpa mengorbankan privasi. Lalu untuk area yang harus mengirim data keluar demi server farm eksternal berskala besar dan akses internet, seperti kueri pencarian AI, mereka bisa memanfaatkan pemimpin pasar
    • Dari sudut pandang pengguna, ini 100% jelas
      Jika sistem tidak mengatakan “saya akan menelepon teman untuk mendapatkan jawaban”, berarti itu 100% lokal, atau dalam skenario terburuk pun tetap berada di dalam Apple Intelligence yang sepenuhnya privat dan dapat diaudit
      Kalau Anda menanyakan resep banana bread, tidak masalah jika diarahkan ke ChatGPT, tetapi Anda mungkin tidak ingin mengirim informasi yang lebih pribadi
    • Ini adalah batas yang jelas antara “data saya ada di perangkat saya atau di dalam ekosistem Apple” dan “data saya meninggalkan Apple dan pergi ke pihak ketiga”
    • Inti dari semua yang diumumkan Apple adalah privasi. Poin utamanya adalah sebagian besar pertanyaan dijawab secara lokal atau lewat sistem Private Compute
      Lebih spesifik lagi, jawaban untuk “apakah OpenAI melihat data pribadi atau pertanyaan saya?” adalah “semuanya diproses di iPhone atau Private Compute, kecuali Anda mengizinkan untuk berbicara dengan OpenAI”
    • Apple menekankan bahwa pekerjaan AI mereka berpusat pada privasi, dan begitu keluar ke ChatGPT, alur itu terputus
      Justru kalau prompt konfirmasi itu tidak memutus alur dan tidak memperjelas kapan hasil dari ChatGPT diambil, saya akan ragu menggunakan fitur AI baru tersebut
  • Ini terlihat benar-benar keren
    Mereka mengatakan modelnya bisa diperluas ke private cloud compute berbasis Apple Silicon, dan perangkat pengguna akan memverifikasi bahwa “publicly verifiable software” berjalan untuk mencegah penyalahgunaan data
    Saya penasaran apakah kode sisi servernya akan menjadi open source. Kalau iya, itu akan menjadi kejutan positif. Saya penasaran bagaimana ini akan berkembang ke depan
    Kalau bekerja sesuai yang diiklankan, rasanya langsung jadi “diam dan ambil uang saya”. Siri akhirnya tampak menjadi seperti yang seharusnya sejak awal, dan saya juga penasaran apakah dengan menumpangkannya di atas katalog Shortcuts Actions, cakupan tugas yang bisa dilakukan sejak awal jadi lebih luas
    Fitur pembuatan gambar dan emoji yang terintegrasi dengan Apple Photos dan bagian lain sistem juga terlihat benar-benar keren. Mac/iPad tampaknya memerlukan M1 atau lebih baru, sedangkan iPhone memerlukan 15 Pro

    • Mereka mengatakan kode sisi server bukan open source, tetapi akan disediakan agar dapat diaudit oleh pakar independen
    • Apple dengan jelas mengatakan iPhone memerlukan 15 Pro atau lebih baru, sedangkan perangkat lainnya memerlukan M1 atau lebih baru