ChatGPT adalah JPEG buram dari web

xguru · 2023-02-14T13:46:32+09:00

Tulisan yang ditulis oleh Ted Chiang, yang dinilai sebagai penulis SF terbaik saat ini Gagasannya adalah bahwa ChatGPT menyimpan informasi dalam bentuk terkompresi, sehingga mirip seperti melihat JPEG buram alih-alih sumber aslinya Pada 2013, ditemukan bahwa mesin fotokopi Xerox mengubah angka menjadi angka lain saat menyalin gambar teknik Masalah ini terjadi karena dalam proses digitalisasi untuk penyalinan, kompresi lossy JBIG2 menyimpan hanya satu angka yang mirip lalu menggunakannya kembali Kasus ini dan ChatGPT dari OpenAI memang tidak mudah dianggap benar-benar serupa, tetapi skenario yang mirip bisa terjadi saat menyimpan informasi dari web Bayangkan jika kita kehilangan akses ke internet Kita ingin membuat salinan dengan mengompresi semua teks di web Namun karena ruang penyimpanan yang tersedia hanya 1% dari ukuran yang dibutuhkan, kita harus memakai algoritme lossy Kini kita bisa menelusuri semuanya, tetapi karena teks terlalu dikompresi, kita tidak bisa menemukan kutipan yang benar-benar akurat Anggap saja ChatGPT adalah JPEG buram dari seluruh teks di web Seperti JPEG, ia mempertahankan banyak informasi dari web, tetapi tidak mempertahankan urutan bit yang benar-benar sama Semua yang Anda dapatkan hanyalah pendekatan Namun pendekatan ini umumnya dapat diterima karena disajikan dalam bentuk teks yang secara tata bahasa sangat baik seperti yang dibuat ChatGPT Cara ini bukanlah penjelasan penuh tentang bagaimana memahami fungsi kompresi lossy pada ChatGPT Tetapi ini juga menjadi cara untuk memahami "halusinasi" ChatGPT atau jawaban tak masuk akal tentang kebenaran Halusinasi semacam ini cukup meyakinkan, seperti angka yang salah dari mesin fotokopi Xerox, sehingga untuk mengenalinya dengan pasti kita perlu membandingkannya dengan sumber asli Model bahasa besar mengidentifikasi keteraturan statistik dalam teks Frasa seperti "pasokan menurun" sering muncul berdekatan dengan kalimat seperti "harga naik" Chatbot yang sering melihat hubungan semacam ini akan menjawab pertanyaan tentang dampak kekurangan pasokan dengan jawaban mengenai kenaikan harga Jika LLM (large language model) telah mengumpulkan banyak korelasi antaristilah ekonomi, apakah itu berarti ia benar-benar memahami teori ekonomi? Model seperti ChatGPT tidak melakukan kompresi lossless. Artinya, model itu tidak merekonstruksi teks asli secara tepat Saat GPT-3 melakukan operasi tambah-kurang pada sepasang angka, untuk 2 digit hasilnya hampir selalu benar, tetapi jika angkanya 5 digit akurasinya turun drastis hingga 10% Ini karena tidak banyak halaman web yang memuat teks seperti "245 + 821" Meskipun mengumpulkan informasi dalam jumlah sangat besar, model itu tetap tidak berhasil menurunkan "prinsip aritmetika" Bayangkan jika ChatGPT adalah algoritme lossless Maka ia akan menjawab pertanyaan dengan mengutip sebagian isi dari halaman web terkait secara apa adanya Kita mungkin hanya akan menganggap perangkat lunak itu sedikit lebih baik daripada mesin pencari yang sudah ada, dan tidak akan terlalu terkesan Fakta bahwa ChatGPT mengekspresikan ulang materi web dengan kata-kata lain alih-alih mengutipnya secara verbatim membuatnya tampak seperti seorang siswa yang mengekspresikan pikirannya dengan kata-katanya sendiri, bukan sekadar mengulang bacaan Inilah yang menciptakan ilusi bahwa ChatGPT memahami materi Banyak kegunaan telah diusulkan untuk LLM, dan dengan menganggapnya sebagai JPEG buram kita bisa menilai mana yang cocok dan mana yang tidak Bisakah model bahasa besar menggantikan pencarian yang ada? Agar yakin pada LLM, kita perlu tahu bahwa mereka tidak mendengar propaganda atau teori konspirasi (apakah mereka dilatih dengan data yang aneh) Kita perlu tahu bahwa JPEG itu menangkap bagian web yang benar Namun bahkan jika LLM hanya memuat informasi yang kita inginkan, tetap ada masalah keburaman Jika ada jenis keburaman yang bisa diterima, itu adalah menjelaskan ulang informasi dengan kata-kata berbeda Dan saat mencari fakta, ada juga keburaman berupa distorsi yang jelas dan sama sekali tidak dapat diterima Belum pasti apakah secara teknis mungkin menghilangkan keburaman yang tidak bisa diterima sambil mempertahankan keburaman yang masih bisa diterima, tetapi kita berharap akan segera mengetahuinya Sekalipun LLM bisa dibatasi agar tidak memalsukan, haruskah kita menggunakannya untuk membuat konten web? Itu hanya masuk akal jika tujuan kita memang sekadar mengemas ulang informasi yang sudah tersedia di web Beberapa perusahaan memang ada untuk melakukan hal seperti ini. Itulah yang kita sebut content farm Bisa jadi keburaman LLM berguna bagi mereka sebagai cara untuk menghindari pelanggaran hak cipta Tetapi secara umum, saya ingin mengatakan bahwa apa yang baik bagi content farm bukanlah hal yang baik bagi orang yang mencari informasi Meningkatnya pengemasan ulang semacam ini telah membuat pencarian sesuatu di internet sekarang menjadi lebih sulit Semakin banyak teks hasil LLM dipublikasikan di web, semakin web menjadi versi yang lebih buram Hampir tidak ada informasi tentang GPT-4, tetapi jika menebak, orang-orang OpenAI kemungkinan berusaha mengecualikan materi yang dihasilkan ChatGPT atau LLM lain saat mengumpulkan teks yang dibutuhkan Jika ini benar, itu akan membantu memastikan apakah analogi antara LLM dan kompresi lossy memang tepat Jika JPEG dikompresi berulang kali, lebih banyak informasi akan hilang sehingga lebih banyak artefak kompresi muncul Seperti menyalin ulang hasil fotokopi di masa lalu, kualitasnya hanya akan semakin buruk Bisakah LLM membantu manusia menghasilkan karya orisinal? Menurut saya, memulai dari salinan buram yang bukan sumber asli bukanlah cara kerja yang baik untuk menciptakan sesuatu yang orisinal Jika Anda seorang penulis, Anda akan menulis banyak karya yang tidak orisinal sebelum menulis sesuatu yang orisinal Waktu dan usaha yang dihabiskan untuk pekerjaan yang tidak orisinal itu tidak terbuang Justru itulah yang pada akhirnya memungkinkan Anda menciptakan sesuatu yang orisinal Waktu yang dihabiskan untuk memilih kata yang tepat dan menyusun ulang kalimat agar mengalir dengan baik mengajarkan bagaimana prosa menyampaikan makna Menugaskan siswa menulis esai bukan sekadar cara untuk menguji pemahaman mereka terhadap materi Itu memberi mereka pengalaman untuk mengekspresikan pikiran mereka dengan jelas Di masa depan, mungkin saja kita membangun AI yang bisa menulis dengan baik hanya berdasarkan pengalamannya sendiri tentang dunia Itu akan menjadi momen penting, tetapi hari ketika hal itu tercapai berada di luar jangkauan prediksi kita Jika kita harus menyimpan salinan pada server dengan ruang terbatas tanpa akses ke internet, model bahasa besar seperti ChatGPT bisa menjadi solusi yang baik "Namun kita belum kehilangan akses ke internet. Kalau yang asli masih ada, mengapa harus memakai JPEG yang buram"?

(newyorker.com)

41 poin oleh xguru 2023-02-14 | 26 komentar | Bagikan ke WhatsApp

Tulisan yang ditulis oleh Ted Chiang, yang dinilai sebagai penulis SF terbaik saat ini
Gagasannya adalah bahwa ChatGPT menyimpan informasi dalam bentuk terkompresi, sehingga mirip seperti melihat JPEG buram alih-alih sumber aslinya
Pada 2013, ditemukan bahwa mesin fotokopi Xerox mengubah angka menjadi angka lain saat menyalin gambar teknik
Masalah ini terjadi karena dalam proses digitalisasi untuk penyalinan, kompresi lossy JBIG2 menyimpan hanya satu angka yang mirip lalu menggunakannya kembali
Kasus ini dan ChatGPT dari OpenAI memang tidak mudah dianggap benar-benar serupa, tetapi skenario yang mirip bisa terjadi saat menyimpan informasi dari web
Bayangkan jika kita kehilangan akses ke internet
- Kita ingin membuat salinan dengan mengompresi semua teks di web
- Namun karena ruang penyimpanan yang tersedia hanya 1% dari ukuran yang dibutuhkan, kita harus memakai algoritme lossy
- Kini kita bisa menelusuri semuanya, tetapi karena teks terlalu dikompresi, kita tidak bisa menemukan kutipan yang benar-benar akurat
Anggap saja ChatGPT adalah JPEG buram dari seluruh teks di web
Seperti JPEG, ia mempertahankan banyak informasi dari web, tetapi tidak mempertahankan urutan bit yang benar-benar sama
Semua yang Anda dapatkan hanyalah pendekatan
Namun pendekatan ini umumnya dapat diterima karena disajikan dalam bentuk teks yang secara tata bahasa sangat baik seperti yang dibuat ChatGPT
Cara ini bukanlah penjelasan penuh tentang bagaimana memahami fungsi kompresi lossy pada ChatGPT
Tetapi ini juga menjadi cara untuk memahami "halusinasi" ChatGPT atau jawaban tak masuk akal tentang kebenaran
Halusinasi semacam ini cukup meyakinkan, seperti angka yang salah dari mesin fotokopi Xerox, sehingga untuk mengenalinya dengan pasti kita perlu membandingkannya dengan sumber asli
Model bahasa besar mengidentifikasi keteraturan statistik dalam teks
Frasa seperti "pasokan menurun" sering muncul berdekatan dengan kalimat seperti "harga naik"
Chatbot yang sering melihat hubungan semacam ini akan menjawab pertanyaan tentang dampak kekurangan pasokan dengan jawaban mengenai kenaikan harga
Jika LLM (large language model) telah mengumpulkan banyak korelasi antaristilah ekonomi, apakah itu berarti ia benar-benar memahami teori ekonomi?
Model seperti ChatGPT tidak melakukan kompresi lossless. Artinya, model itu tidak merekonstruksi teks asli secara tepat
Saat GPT-3 melakukan operasi tambah-kurang pada sepasang angka, untuk 2 digit hasilnya hampir selalu benar, tetapi jika angkanya 5 digit akurasinya turun drastis hingga 10%
Ini karena tidak banyak halaman web yang memuat teks seperti "245 + 821"
Meskipun mengumpulkan informasi dalam jumlah sangat besar, model itu tetap tidak berhasil menurunkan "prinsip aritmetika"
Bayangkan jika ChatGPT adalah algoritme lossless
Maka ia akan menjawab pertanyaan dengan mengutip sebagian isi dari halaman web terkait secara apa adanya
Kita mungkin hanya akan menganggap perangkat lunak itu sedikit lebih baik daripada mesin pencari yang sudah ada, dan tidak akan terlalu terkesan
Fakta bahwa ChatGPT mengekspresikan ulang materi web dengan kata-kata lain alih-alih mengutipnya secara verbatim membuatnya tampak seperti seorang siswa yang mengekspresikan pikirannya dengan kata-katanya sendiri, bukan sekadar mengulang bacaan
Inilah yang menciptakan ilusi bahwa ChatGPT memahami materi
Banyak kegunaan telah diusulkan untuk LLM, dan dengan menganggapnya sebagai JPEG buram kita bisa menilai mana yang cocok dan mana yang tidak
Bisakah model bahasa besar menggantikan pencarian yang ada?
- Agar yakin pada LLM, kita perlu tahu bahwa mereka tidak mendengar propaganda atau teori konspirasi (apakah mereka dilatih dengan data yang aneh)
- Kita perlu tahu bahwa JPEG itu menangkap bagian web yang benar
- Namun bahkan jika LLM hanya memuat informasi yang kita inginkan, tetap ada masalah keburaman
- Jika ada jenis keburaman yang bisa diterima, itu adalah menjelaskan ulang informasi dengan kata-kata berbeda
- Dan saat mencari fakta, ada juga keburaman berupa distorsi yang jelas dan sama sekali tidak dapat diterima
- Belum pasti apakah secara teknis mungkin menghilangkan keburaman yang tidak bisa diterima sambil mempertahankan keburaman yang masih bisa diterima, tetapi kita berharap akan segera mengetahuinya
Sekalipun LLM bisa dibatasi agar tidak memalsukan, haruskah kita menggunakannya untuk membuat konten web?
- Itu hanya masuk akal jika tujuan kita memang sekadar mengemas ulang informasi yang sudah tersedia di web
- Beberapa perusahaan memang ada untuk melakukan hal seperti ini. Itulah yang kita sebut content farm
- Bisa jadi keburaman LLM berguna bagi mereka sebagai cara untuk menghindari pelanggaran hak cipta
- Tetapi secara umum, saya ingin mengatakan bahwa apa yang baik bagi content farm bukanlah hal yang baik bagi orang yang mencari informasi
- Meningkatnya pengemasan ulang semacam ini telah membuat pencarian sesuatu di internet sekarang menjadi lebih sulit
Semakin banyak teks hasil LLM dipublikasikan di web, semakin web menjadi versi yang lebih buram
Hampir tidak ada informasi tentang GPT-4, tetapi jika menebak, orang-orang OpenAI kemungkinan berusaha mengecualikan materi yang dihasilkan ChatGPT atau LLM lain saat mengumpulkan teks yang dibutuhkan
Jika ini benar, itu akan membantu memastikan apakah analogi antara LLM dan kompresi lossy memang tepat
Jika JPEG dikompresi berulang kali, lebih banyak informasi akan hilang sehingga lebih banyak artefak kompresi muncul
Seperti menyalin ulang hasil fotokopi di masa lalu, kualitasnya hanya akan semakin buruk
Bisakah LLM membantu manusia menghasilkan karya orisinal?
- Menurut saya, memulai dari salinan buram yang bukan sumber asli bukanlah cara kerja yang baik untuk menciptakan sesuatu yang orisinal
- Jika Anda seorang penulis, Anda akan menulis banyak karya yang tidak orisinal sebelum menulis sesuatu yang orisinal
- Waktu dan usaha yang dihabiskan untuk pekerjaan yang tidak orisinal itu tidak terbuang
- Justru itulah yang pada akhirnya memungkinkan Anda menciptakan sesuatu yang orisinal
- Waktu yang dihabiskan untuk memilih kata yang tepat dan menyusun ulang kalimat agar mengalir dengan baik mengajarkan bagaimana prosa menyampaikan makna
- Menugaskan siswa menulis esai bukan sekadar cara untuk menguji pemahaman mereka terhadap materi
- Itu memberi mereka pengalaman untuk mengekspresikan pikiran mereka dengan jelas
Di masa depan, mungkin saja kita membangun AI yang bisa menulis dengan baik hanya berdasarkan pengalamannya sendiri tentang dunia
Itu akan menjadi momen penting, tetapi hari ketika hal itu tercapai berada di luar jangkauan prediksi kita
Jika kita harus menyimpan salinan pada server dengan ruang terbatas tanpa akses ke internet, model bahasa besar seperti ChatGPT bisa menjadi solusi yang baik
"Namun kita belum kehilangan akses ke internet. Kalau yang asli masih ada, mengapa harus memakai JPEG yang buram"?

26 komentar

bleu28 2023-02-26

Saya sudah mencoba bertanya berulang kali dengan operasi penjumlahan dan pengurangan 5 digit atau lebih, dan terus mendapatkan jawaban yang akurat.
Jadi, di bagian mana sebenarnya akurasinya mulai menurun?

flaps3 2023-02-20

Poin yang diabaikan Ted Chiang adalah bahwa Google Search, yang selama ini digunakan sebagai cara utama menjelajahi internet, dalam beberapa tahun terakhir kualitasnya banyak menurun karena terdampak banjir konten web berkualitas rendah.
Meskipun ChatGPT adalah JPEG yang buram, jika alternatifnya hanya Google Search yang penuh noise, maka menggunakan ChatGPT sebagai sarana terbaik untuk memperoleh informasi saat ini bisa jadi merupakan pilihan yang masuk akal.
Dikatakan bahwa "kita tidak kehilangan hak akses ke internet", tetapi justru bagian inilah premis yang keliru. Jika memikirkan skala web yang sangat besar, saya melihat kehilangan kemampuan menelusuri pada dasarnya memiliki makna yang sama dengan kehilangan hak akses. Apa gunanya punya hak akses jika saya tidak bisa menemukan informasi yang saya inginkan?
Dengan kata lain, situasinya makin mendekati keadaan seolah tidak ada "yang orisinal", dan saya rasa itulah alasan mengapa orang-orang sekarang merasa perlu "menggunakan JPEG yang buram".

laeyoung 2023-02-16

Saya rasa komentar yang ditinggalkan lightgreenmaesil di bawah ini menunjukkan perbedaan antara sudut pandang Ted Chiang dan mereka yang berada di sisi sebaliknya.

"Pertama, ukurannya juga lebih besar, dan waktu yang dibutuhkan untuk melihatnya pun jauh lebih lama. Kalau foto, mungkin durasinya agak sulit terasa nyata, tetapi jika diibaratkan sebagai satu buku dan satu halaman yang merangkum inti buku itu, rasanya akan lebih terasa."

Kalau melihat popularitas atau jumlah tayangan hal-hal seperti rangkuman film 15 menit atau ringkasan buku di YouTube, memang benar orang-orang menyukai hal seperti itu. Shorts juga begitu. Namun, kalau dipikir apakah ringkasan-ringkasan itu bisa sepenuhnya merepresentasikan karya aslinya, sepertinya jawaban yang tepat adalah tidak. Bagi orang yang tersentuh setelah melihat karya aslinya, hal-hal yang hilang dari ringkasan akan terasa besar.

Dari sudut pandang Ted Chiang yang seorang novelis, apa yang dilakukan ChatGPT atau LLM mungkin terasa seperti melihat tulisan yang merangkum novelnya menjadi 1~2 halaman. Dan ketika melihat orang-orang yang mengatakan, atau menganggap, bahwa seluruh novel itu sudah termuat di dalam tulisan pendek tersebut, ia tentu akan bertanya-tanya apakah itu masuk akal.

Demikian juga, apakah sutradara film atau para aktor akan menyukai orang-orang yang hanya menonton ringkasan film 15 menit alih-alih karya aslinya? Apakah mereka akan menganggap orang-orang itu sebagai penonton karya mereka? Lebih jauh lagi, bagaimana jika hampir semua orang mulai menganggap ringkasan 15 menit lebih terasa seperti film daripada film yang sebenarnya? Jika sampai akhirnya film tidak bisa lagi dibuat, lalu ringkasan 15 menit itu akan menonton film apa untuk diringkas?

Ini memang zaman yang suka merangkum video maupun tulisan, lalu menikmatinya dengan cepat dan padat, tetapi menariknya hanya musik yang tetap bertahan apa adanya. Tidak ada orang yang mendengarkan musik dalam bentuk ringkasan, atau mendengarkannya pada kecepatan 2x, atau melewati bagian-bagian yang membosankan per 10 detik.

Kalau begitu, di zaman sekarang yang seolah berjiwa 2x speed dan cuplikan 1 menit ini, bisakah saya yang mendengarkan Ditto dari NewJeans dengan cara seperti itu menjadi penggemar NewJeans? Bisakah saya tetap mengatakan bahwa saya sudah mendengarkan lagu itu meski saya menikmatinya dalam bentuk yang dipadatkan dan diringkas? Atau tidak? Atau sebenarnya tidak masalah?

fudiso 2023-02-15

Seperti Ted Chiang sendiri yang menggunakan analogi JPEG terkompresi lossy untuk menjelaskan model bahasa, informasi hasil kompresi tetap diperlukan meskipun versi aslinya ada.
Dan meskipun model bahasa belajar lagi dari hasil yang dibuatnya sendiri, hampir tidak ada kehilangan informasi. (Pembaruan pada parameter model internal hampir tidak terjadi. Karena itu adalah informasi yang sudah diketahui sejak awal, tidak ada efek pembelajaran.)

stdcarrot 2023-02-15

Sepertinya ada perbedaan antara teks asli dan nuansa terjemahan pada bagian terjemahan untuk pertanyaan terakhir, sehingga jika hanya melihat versi terjemahannya, tampaknya muncul banyak komentar yang berbeda dari maksud tulisan aslinya.

So just how much use is a blurry jpeg, when you still have the original?
Seberapa bergunakah file JPEG yang buram, ketika Anda masih memiliki file aslinya?

Menurut saya, ini tampak seperti pertanyaan yang mencari kegunaan JPEG ketika Anda memiliki file RAW,
namun karena ditafsirkan sebagai "apa gunanya memakainya", kesannya jadi seperti "kalau sudah ada RAW, kenapa pakai yang seperti JPEG?"

Tentu saja, di dunia nyata ada alasan mengapa JPEG lebih umum digunakan daripada RAW, jadi menurut saya pertanyaan itu juga mencakup sudut pandang tersebut.

pseudojo 2023-02-15

Kadang bahkan dokumentasi resmi open source atau dokumentasi resmi AWS pun terasa kurang bisa dipercaya, jadi kita harus menjalankannya langsung untuk memastikan, atau bahkan memeriksa source code-nya; apalagi ChatGPT.... Rasanya makin banyak informasi, makin banyak pula beban verifikasi silang yang harus dilakukan manusia secara tidak perlu.

daumkakao 2023-02-15

Bukankah kita memang tidak bisa membedakan JPEG dengan versi aslinya?

laeyoung 2023-02-16

Tergantung pada karakteristik gambar dan tingkat kompresinya. Jika Anda seorang fotografer, biasanya Anda lebih memilih menyimpan file asli terpisah dari JPEG. Saat nanti mengedit dan melakukan koreksi, rentang pengeditan yang memungkinkan dengan file JPEG dan dengan file asli sangat berbeda.

https://www.keptlight.com/does-size-matter/

botplaysdice 2023-02-15

Bukankah pekerjaan yang sedang dilakukan sebagian besar manusia saat ini demi mencari nafkah justru adalah membuat JPEG buram itu.

namjun 2023-02-15

ChatGPT memang sangat hebat, tetapi terasa terlalu mirip manusia sehingga kurang cocok untuk pencarian dan penyampaian informasi.

ahwjdekf 2023-02-15

Saya sangat setuju dengan anggapan bahwa ini mirip seperti melihat JPEG buram, bukan yang asli. Misalnya saat membaca buku terjemahan, kalau penafsiran bebas penerjemah sangat banyak tercermin, meski di tengah terasa ada bagian terjemahan yang aneh, kalau kata-katanya terus tersambung dengan mulus dan konteks besarnya terasa kurang lebih cocok, biasanya saya tetap lanjut membalik halaman (meski apakah setelah selesai dibaca itu benar-benar bisa dipahami atau tidak adalah persoalan lain). Tapi terjemahan yang terasa aneh itu bisa saja sebenarnya ngawur, jadi ini bukan masalah yang bisa diabaikan. Bagi sebagian orang terjemahan seperti ini mungkin sama sekali tidak bisa diterima, sementara bagi yang lain mungkin masih pada tingkat yang bisa ditoleransi.

norimsu 2023-02-15

Hmm. Kualitas gambarnya jelek.

tequila 2023-02-15

Mungkin ini juga bisa dimaknai sebagai semacam peringatan. Saya sendiri memakainya untuk banyak hal, baik saat bekerja, saat membutuhkan saran, maupun saat merapikan kalimat, tetapi jelas ada kalanya ia memberikan jawaban yang tampak meyakinkan namun sebenarnya salah. Dan memang benar juga bahwa agar pengguna tahu jawaban ini salah, mereka perlu punya pengetahuan tentang bidang tersebut atau melakukan riset tambahan. Kadang bahkan ada kesalahan yang baru bisa disadari jika diperiksa dengan sangat detail. (misalnya saat menghasilkan kode, ia menggunakan fungsi yang sebenarnya tidak ada)
Sebelum menemukan kesalahan seperti itu, sejujurnya saya tidak pernah membayangkan bahwa AI ini akan memberi saya jawaban dengan cara seperti itu. Yang saya bayangkan hanya bahwa ia mungkin sama sekali tidak bisa menjawab, atau memberi jawaban yang ngawur.

Melihat adanya sedikit demi sedikit gesekan terkait jawaban AI bahkan di tempat seperti Stack Overflow, yang penggunanya relatif lebih memahami teknologi semacam ini, tampaknya verifikasi yang benar-benar sempurna di kalangan pengguna pun tidak terjadi seperti yang dibayangkan. Verifikasi terhadap data yang dihasilkan AI memerlukan campur tangan manusia, dan jelas merupakan pekerjaan yang membutuhkan tenaga serta pengetahuan. Kalau tidak, Microsoft tidak akan melewatkan kesalahan yang tampak meyakinkan dari AI mereka sendiri. Karena itu, kita tahu bahwa untuk saat ini teknologi ini harus dimanfaatkan sebagai alat. Namun ketika kita bertanya pada AI di ponsel tentang cuaca hari ini, kita hampir tidak pernah berasumsi bahwa jawaban itu bisa salah karena bug atau kesalahan lain. Ketika AI seperti ChatGPT perlahan berkembang menjadi AI umum yang makin dekat dengan kehidupan sehari-hari, bukankah kemungkinan pengguna menerima jawabannya tanpa banyak curiga akan menjadi tinggi?

Belakangan ini, di sekolah cukup banyak kasus penulisan esai oleh ChatGPT dan sejenisnya. Bukan sekadar dipakai untuk menunjukkan kesalahan, memberi bahan untuk menulis, atau mengembangkan tulisan, tetapi ada kasus yang sampai diberitakan, di mana orang tanpa benar-benar memikirkan persoalannya menyalin jawaban AI secara serampangan dengan hanya mengganti sedikit kata-katanya lalu mendapatkan nilai tinggi. Dalam situasi ketika seseorang diminta menyampaikan pemikirannya sendiri berdasarkan bahan yang diteliti langsung, menyerahkan pemikiran, penyusunan, dan penulisan kepada AI jelas merupakan paradigma baru.

Terlepas dari AI, kadang ada banyak sekali materi yang salah tersebar di internet, dan banyak orang mempercayainya sebagai fakta tanpa pemeriksaan tambahan. Saya sendiri pun, jika tidak membacanya sambil memverifikasi satu per satu, mungkin sudah sering menerima informasi yang salah tanpa sadar.
Sering ada candaan tentang pelapukan data. Saat foto beredar dan dibagikan ke berbagai situs di internet sebagai jpg, proses resize dan kompresi ukuran file yang berulang sering kali membuat kualitas gambarnya jadi berantakan. Bahkan latar belakang yang putih bersih pun bisa berubah menjadi kebiruan.
Saya rasa kekhawatirannya mungkin seperti degradasi informasi. Ada pepatah bahwa uang buruk mengusir uang baik, bukan?
Situs berbagi gambar sudah dipenuhi gambar buatan AI. Ini sendiri bukan hal yang salah, tetapi jika internet juga dipenuhi artikel-artikel perkiraan yang ditulis AI, lalu AI yang berbasis pada itu kembali menghasilkan artikel, dan proses itu terus berulang, bukankah distorsi terhadap informasi bisa sedikit demi sedikit terakumulasi? Itulah yang saya pikirkan.

rousseau 2023-02-15

Saya sudah membaca SF selama lebih dari 30 tahun, dan sebagai penggemar garis keras yang menempatkan 'Story of Your Life' sebagai karya terbaik di antara SF baru yang saya baca dalam hampir 10 tahun terakhir, saya tetap merasa harus membantah ini dari sudut pandang seseorang yang telah bekerja lebih dari 20 tahun sebagai developer di industri ini.

Pada dasarnya, pernyataan ini lahir dari sudut pandang yang bisa dibilang angkuh. Pandangannya adalah: orang-orang akan salah paham dan mengira platform AI seperti ChatGPT telah mencapai ranah kreasi, tetapi saya tahu itu tidak benar, jadi saya harus memberitahukan kebenaran yang sesungguhnya kepada mereka.

Fakta yang benar justru adalah bahwa bukan hanya pelaku industri, tetapi juga kebanyakan orang sudah tahu bahwa itu tidak demikian. Sejak AlphaGo, AI sudah lama menjadi topik utama di publik. Semua orang juga kurang lebih tahu kemampuan dan batasan AI. Di dunia AI baduk saat ini, para jagoan sudah bermunculan sampai-sampai level AlphaGo pun diperlakukan seperti bayi, tetapi tak seorang pun menerimanya sebagai sesuatu yang mengejutkan. Itu karena orang-orang sudah banyak belajar tentang apa artinya dan bagaimana harus menerimanya.

Saya justru melihat pernyataan Ted Chiang itu sebagai kekeliruan yang berasal dari ketidaktahuan dan prasangka terhadap publik. Publik yang antusias terhadap ChatGPT bukan bersikap demikian karena percaya bahwa itu akan menggantikan aktivitas intelektual kita. Mereka semua tahu betul bahwa itu akan 'membantu' aktivitas intelektual kita, dan memang menggunakannya seperti itu. Contoh prompt dibakukan seperti manual dan dibagikan. Dari situ terlihat jelas bahwa orang-orang memahami ini sebagai alat.

Bagaimana orang-orang menerima AI pembuat gambar? Apakah mereka menggosoknya seperti lampu ajaib agar AI itu menggantikan kreasi mereka? Sekitar 90% gambar AI yang saya lihat belakangan ini adalah gambar dewasa. Kalau dibilang buram karena tangan masih sering salah digambar, ya memang buram, tetapi bagian lainnya justru rapi dan jelas.

Masih banyak yang ingin saya katakan, tetapi karena terlalu banyak, saya akhiri dengan satu kalimat saja.

"Pak Kim. Saya berani ingin memberi saran. Bukan hal lain, jangan terlalu sering memakai fungsi Excel? Kalau ada kemudahan, risikonya juga meningkat. Untuk menyembelih sapi ada mata pisau yang sepadan, tetapi untuk menangkap ayam apakah perlu pisau?...... Menurut saya, berhitung di kepala bisa lebih cepat, dan tentu tiap orang berbeda, kalkulator memang bisa bagus. Apakah komputer itu pisau untuk menyembelih sapi, itulah pendapat yang ingin saya sampaikan."

lightgreenmaesil 2023-02-15

Pertanyaan terakhirnya keliru. Perbandingannya seharusnya bukan dengan JPEG buram, melainkan dengan ringkasan verbal dari sebuah foto JPEG. Misalnya, teks seperti "anjing yang menjulurkan lidah" dibandingkan dengan foto aslinya. Ini juga merupakan sejenis kompresi lossy. Sebagian besar informasinya dihapus dan dikompresi hanya menjadi beberapa byte teks. Tetapi apakah kompresi lossy seperti ini tidak bernilai hanya karena foto aslinya ada? Tentu tidak. Pertama, ukurannya lebih besar, dan juga butuh waktu lebih lama untuk melihatnya. Untuk foto, aspek waktu mungkin terasa kurang nyata, tetapi jika dibayangkan sebagai satu buku penuh dibandingkan satu halaman yang merangkum inti buku itu, rasanya akan lebih jelas.

Kalau begitu, jika ada sebuah makalah, adakah alasan untuk melihat ringkasannya yang merupakan kompresi lossy dari makalah tersebut? Tentu ada, dan dalam situasi tertentu sangat berguna. Jika ada sebuah buku, adakah alasan untuk menggunakan ringkasan tentang klaim tertentu yang disebutkan dalam salah satu babnya? Tentu saja ada. Dilihat dari sudut tertentu, ketika manusia pergi ke sekolah, mendengarkan kuliah selama puluhan jam, lalu merangkum dan menyusunnya menjadi catatan atau cheating sheet, itu juga merupakan kompresi lossy yang sangat besar dari video menjadi tulisan. Belajar itu sendiri adalah kompresi lossy. Apakah itu tidak berguna?

"Kompresi" dianalogikan dengan kompresi foto seolah-olah itu sesuatu yang sangat sepele dan tidak punya makna besar, tetapi sebenarnya kompresi adalah pekerjaan yang sangat esensial dan bermakna dalam pembelajaran manusia. Dalam kasus foto, metode kompresinya sudah cukup banyak dipahami, tetapi kompresi bahasa adalah hal yang sangat non-trivial dan penting.

cenoch 2023-02-15

Jawaban atas pertanyaan terakhir adalah

meskipun informasi yang kita terima melalui GPT adalah versi JPEG yang terdegradasi,
informasi yang kita inginkan pada umumnya adalah versi kolase, dan upaya yang dibutuhkan untuk menyusun kolase ini cukup besar.

Karena ia menggantikan upaya membuat kolase itu, dan kadang kualitas keseluruhannya bahkan lebih baik daripada keterampilan tangan saya sendiri,
maka penurunan kualitas gambar itu cukup layak untuk ditoleransi.

Tentu saja, mungkin saya bukan orang yang berada pada posisi untuk menilai imajinasi dan pemahaman Ted Chiang tentang teknologi, tetapi
secara keseluruhan, saya mendapat kesan bahwa ini adalah hasil yang terlalu membesar-besarkan beberapa karakteristik teknologi ini,
dan justru melewatkan karakteristik yang benar-benar penting.

johtta88 2023-02-14

Jawaban untuk pertanyaan terakhir mungkin adalah "karena nyaman", bukan?
Saya tidak yakin apakah ini analogi yang tepat, tetapi belakangan ini tingkat kepuasan terhadap hal-hal yang merupakan versi terkompresi dari karya orisinal, seperti maraton menonton film/drama, tampaknya juga tinggi.

regentag 2023-02-14

Ini tampaknya analogi yang sangat bagus, tetapi mustahil dipahami jika Anda bukan orang yang bekerja di industri ini.
Bagaimana cara menjelaskannya kepada orang non-ahli (termasuk mereka yang sok seperti ahli)?

yhkee0404 2023-02-14

Super Resolution bisa lebih baik daripada yang asli

wedding 2023-02-15

Tentu bisa jadi lebih baik, tetapi bukankah tulisan itu juga menunjukkan bahwa itu tidak selalu lebih baik?

yhkee0404 2023-02-15

Katanya bisa menjadi lebih baik, tapi tentu saja tidak selalu membaik tanpa syarat. Namun, tulisan itu hanya mengatakan bahwa resolusinya buram, sambil mengabaikan kemungkinan sebaliknya bahwa ia bisa menjadi lebih jelas. Kualitas gambar CCTV juga terus ditingkatkan dan gambar hitam-putih pun diberi warna, sedangkan JPEG di judul itu tidak mendukung hal seperti itu.

seunghaekim 2023-02-15

Peningkatan kualitas gambar, yaitu meningkatkan kualitas CCTV, dalam beberapa aspek sebenarnya bukanlah peningkatan. Itu memberikan 'sensasi' kepada manusia bahwa gambar tersebut telah ditingkatkan. Hal yang sama berlaku untuk memberi warna pada gambar hitam-putih. Dengan 'menghasilkan' gambar hitam-putih yang telah diberi warna, itu memberikan manusia 'sensasi' gambar berwarna. Karena itu, 'peningkatan' yang ditangani teknologi peningkatan kualitas gambar saat ini adalah isu yang harus dibahas dalam aspek yang sangat sempit. Perbandingan bahwa JPEG tidak mendukung hal semacam itu dalam konteks peningkatan kualitas CCTV adalah perbandingan yang sangat tidak adil.

yhkee0404 2023-02-15

Terima kasih atas komentarnya. Namun, dengan logika yang sama, fakta bahwa sesuatu itu kabur juga dalam aspek tertentu bukanlah degradasi, melainkan menghadirkan "sensasi" dengan "menghasilkan" sesuatu yang sudah terdegradasi, jadi ini isu yang harus dibahas dalam sudut pandang yang sangat sempit. Karena itu, membandingkan kemampuan matematika ChatGPT dengan degradasi JPEG juga terasa sangat tidak adil, bukan? Saat yang ingin ditingkatkan adalah jumlah informasi itu sendiri, rasanya tidak perlu membawa-bawa hal seperti "sensasi" manusia. Seperti halnya ukuran berkurang saat warna asli dikompresi menjadi hitam-putih, jika warna ditambahkan kembali secara terbalik maka bukan hanya kapasitas bit yang bertambah, tetapi jumlah informasinya sendiri juga meningkat. Dalam hal ini, itu lebih mirip dekompresi atau pemulihan ke bentuk asli daripada kompresi. Hanya karena itu bukan benar-benar yang asli, rasanya jauh lebih tidak adil untuk menyebutnya kabur. Kalau hanya melihat judulnya, orang bisa salah paham dan mengira DALL-E juga hanya bisa membuat gambar berkapasitas rendah dan beresolusi rendah, dan tidak bisa membuat HD. Seperti yang tertulis di artikel, jika JPEG dikompresi berulang kali, umumnya ukuran akan mengecil, kualitas gambar menurun, dan hasilnya mau tak mau menjadi kabur. Namun saya harap tidak diabaikan fakta bahwa deep learning, meskipun bisa kabur saat melakukan perhitungan matematika dengan data yang sedikit, justru sebaliknya ada juga bagian-bagian yang dikerjakannya dengan lebih jelas dan akurat.

seunghaekim 2023-02-15

Tidak ada satu pun poin dalam ucapan Anda yang saya lewatkan. Anda sedang membuat yang asli, dan tampaknya Anda sangat marah karena saya membuat 'sesuatu yang bukan asli, tetapi terasa seperti yang asli'. Suka atau tidak, itulah fakta sederhananya, jadi mau bagaimana lagi.

yhkee0404 2023-02-15

Saya sebenarnya tidak mengekspresikan emosi bahwa saya sangat marah atau merasa ini sangat tidak adil, kan? Saya hanya khawatir publik akan melihat judul artikel yang mengatakan bahwa orang bernama Ted Chiang ini yang mengatakannya lalu melewatkannya begitu saja. Sepertinya kebanyakan orang setuju, dan syukurlah Anda mengenalnya secara pribadi. Saya setuju bahwa membuat sesuatu yang analog secara digital itu sulit. Karena ini bicara tentang teks, itu di luar pembahasan.

xguru 2023-02-14

Masalah mesin fotokopi Xerox ini ternyata juga pernah saya lihat di #33 dari 52 hal yang saya pelajari pada 2022.
Menarik sekali ketika ini terhubung ke arah sini, jadi langsung paham!

ChatGPT adalah JPEG buram dari web

Bacaan terkait

26 komentar