- Hampir tidak ada orang yang menyukai perangkat lunak untuk bekerja
- Bahkan produk terbaik pun, ketika diterapkan pada pekerjaan nyata, sering tidak fleksibel atau tidak cukup matang, dengan kurva pembelajaran yang curam dan sulit diakses
- AI generatif menawarkan peluang untuk sepenuhnya menciptakan ulang alur kerja dan memungkinkan pembuatan produk yang benar-benar baru dari awal
- Alur kerja AI-native membantu pengguna menyelesaikan pekerjaan yang sudah ada dengan lebih efisien
- Platform-platform ini memungkinkan pengguna mendelegasikan tugas tingkat rendah ke asisten AI, sehingga dapat mengalokasikan lebih banyak waktu untuk berpikir tingkat tinggi
- Membantu membuka kemampuan teknis dan estetika baru agar siapa pun dapat menjadi programmer, produser, desainer, atau musisi
- Kesenjangan antara kreativitas dan keterampilan teknis akan menyempit
- Dengan produk “AI-native” yang “berskala profesional namun ramah konsumen”, siapa pun dapat menjadi “prosumer” generasi berikutnya
- (Prosumer: orang yang sekaligus menjadi produsen dan konsumen. Alvin Toffler memperkenalkannya dalam “The Third Wave”)
Bagaimana Bentuk Produk Prosumer AI-Native GenAI?
- Semua produk alur kerja GenAI-native memiliki karakteristik umum: mengubah model mutakhir menjadi UI yang dapat diakses dan efektif
- Pengguna lebih tertarik pada bagaimana produk membantu mereka daripada memikirkan infrastruktur di balik produk
- Terobosan teknis yang dicapai melalui GenAI memang mengesankan, tetapi produk yang berhasil tetap berawal dari pemahaman mendalam terhadap pengguna dan masalah yang mereka hadapi
- Produk yang berhasil berfokus pada:
- Memahami titik sakit pengguna secara mendalam
- Apa yang bisa diagregasi/dia... abstract dengan AI
- Di mana keputusan yang membutuhkan persetujuan
- Di mana terdapat titik leverage yang memberikan dampak terbesar
Fitur Utama Produk Prosumer AI-Native GenAI
- Alat generatif yang menyelesaikan masalah “halaman kosong”
- Membantu memulai dengan membuat media dari prompt bahasa alami
- Dapat dijalankan dengan model eksklusif atau menggabungkan beberapa model
- Contoh: alat rendering Vizcom, website builder Durable
- Kombinasi multimodal (dan multimedia)
- Banyak proyek kreatif membutuhkan lebih dari satu jenis konten: gambar dan teks, musik dan video, animasi dan narasi suara, dan sebagainya
- Namun saat ini belum ada model tunggal yang bisa menghasilkan semua jenis aset tersebut
- Ini menciptakan peluang untuk produk alur kerja di mana pengguna bisa menghasilkan, menyempurnakan, dan menggabungkan berbagai jenis konten di satu tempat
- Contoh: avatar HeyGen (menciptakan avatar yang berbicara realistis dengan menggabungkan avatar buatan sendiri dan TTS dari ElevenLabs)
- Editor cerdas yang memungkinkan lebih banyak iterasi
- Hasil kerja yang “langsung jadi” hampir tidak ada
- Untuk AI dengan elemen acak yang sangat khas, ini makin terasa; hampir tidak mungkin mendapatkan hasil tepat seperti yang diinginkan pada eksekusi pertama
- Menekan tombol regenerasi atau mengedit prompt penting, tetapi prosesnya memakan banyak waktu dan mengecewakan
- Gelombang pertama produk AI tidak mengizinkan pengulangan sama sekali. Menjalankan prompt yang sama lagi dapat menghasilkan hasil yang sangat berbeda
- Kini mulai terlihat fitur yang memungkinkan pengguna mengambil output yang sudah ada dan menyempurnakannya tanpa harus memulai dari awal
- Contoh: alat variasi dan zoom Midjourney, fitur edit area spesifik di Pika
- Refinement (penyempurnaan) di dalam platform
- Unsur penting lain dari penyuntingan cerdas adalah refinement
- Sepuluh persen akhir dari pekerjaan polishing sering menjadi perbedaan antara membuat sesuatu yang “bagus” dan sesuatu yang “hebat”
- Namun (1) menemukan apa yang perlu disempurnakan, dan (2) menyempurnakannya tanpa perlu berpindah ke tempat lain, bisa sangat sulit
- Produk alur kerja AI membantu mengidentifikasi aspek yang bisa ditingkatkan, lalu membantu memperbaikinya secara otomatis
- Mirip dengan “auto retouch” untuk foto di Apple, tetapi fungsional untuk hampir segala sesuatu
- Contoh: fitur upscaling Krea, alur kerja audiobook ElevenLabs
- Output yang bisa di-remix dan dikonversi
- Setiap konten dapat menjadi titik awal potensial untuk iterasi lain
- Jika Anda pernah menyalin dan mengubah prompt buatan orang lain di Midjourney/ChatGPT, Anda sudah termasuk dalam konteks ini
- Platform yang memanfaatkan fleksibilitas ini dengan baik dapat membuat produk yang lebih kuat dan lebih menempel
- Bagi pembuat konten awal, nilainya besar karena memungkinkan konversi pekerjaan lintas media, misalnya mengubah video menjadi posting blog, atau mengubah dokumen teks menjadi animasi video petunjuk penggunaan
- Contoh: fitur inti platform publishing Gamma: menghasilkan deck, dokumen, atau halaman web dari prompt atau file yang diunggah, dan memungkinkan konversi format bila diperlukan
- Dengan produk seperti ini, alur kerja juga bisa dibuka agar orang lain bisa mengulanginya
- Bisa berupa urutan prompt atau kombinasi model, atau tombol “salin” agar pengguna dengan kemampuan teknis rendah dapat meniru output atau estetika
- Contoh: Imagen AI, platform editing untuk fotografer profesional:
- Membantu melatih model berdasarkan gaya masing-masing fotografer agar penyuntingan massal menjadi lebih mudah
- Selain itu, pengguna juga dapat mengedit dengan gaya fotografer kelas teratas di industri yang profilnya ditampilkan di platform
Bagaimana Produk Prosumer Akan Berevolusi?
- Alat prosumer generasi berikutnya masih pada tahap awal
- Kemampuan inti pembuatan aset dari alat yang ada akhirnya sudah cukup kuat untuk menambahkan alur kerja yang berarti, tetapi sebagian besar produk masih fokus pada satu jenis konten saja dan secara fungsi masih cukup terbatas
- Produk yang diantisipasi
- Alat editing yang menggabungkan berbagai modality konten
- Video bisa menjadi contoh terbaik
- Untuk membuat film pendek dengan AI saat ini, pengguna perlu membuat beberapa klip di produk seperti Pika atau Runway, lalu pindah ke platform lain seperti Capcut atau Kapwing untuk mengedit atau mixing audio
- Bagaimana jika semua langkah proses ini dapat dilakukan dalam satu platform?
- Diperkirakan sejumlah produk generasi berikutnya akan menambahkan lebih banyak fungsi alur kerja dan memperluas ke pembuatan jenis konten lain melalui pelatihan model sendiri, penggunaan model open source, atau kemitraan dengan pemain lain
- Kemungkinan juga akan muncul editor AI-native independen baru yang memungkinkan pengguna memasang berbagai model sebagai “plugin”
- Produk yang memanfaatkan mode interaksi lain
- Teks prompt tidak selalu cara paling efektif untuk berkomunikasi dengan produk AI
- Kami percaya orang harus bisa bekerja dengan alat generatif seperti saat berkolaborasi dengan partner brainstorming manusia melalui suara, sketsa, atau berbagi foto informasi
- Antisipasi terbesar saat ini adalah suara sebagai format untuk berbagi pemikiran yang lebih halus dan kompleks (atau menjelajah kata-kata dengan cara yang sulit dilakukan lewat teks)
- Produk seperti Oasis, TalkNotes, dan AudioPen, yang mulai muncul, dapat mengubah voice note menjadi email, posting blog, atau tweet
- Ke depan diperkirakan lebih banyak produk alur kerja akan menyediakan audio dan video sebagai input, mengubah cara dan waktu orang bekerja
- Produk yang memperlakukan konten manusia dan AI secara setara
- Akan sangat baik jika ada alat yang memungkinkan penggunaan konten buatan AI dan manusia secara berdampingan. Saat ini mayoritas produk cenderung fokus pada salah satunya.
- Misalnya, sangat unggul dalam mengoreksi foto nyata tetapi tidak dapat melakukan apa pun pada gambar AI.
- Atau bisa menghasilkan video baru tetapi tidak bisa mengoreksi klip atau mengubah gaya dari iPhone
- Kedepan, mayoritas pembuat konten profesional diperkirakan akan mengolah campuran konten buatan AI dan manusia
- Produk yang mereka gunakan harus bisa menerima kedua jenis konten dan menggabungkannya lebih mudah
- Alat editing Runway menunjukkan hal ini dengan baik
- Mengambil klip dan gambar dari model generatif sendiri dan mengunggah aset nyata agar bisa dipakai pada timeline yang sama
- Kemudian dua jenis “alat ajaib” perusahaan seperti inpainting dan green screen bisa digunakan untuk kedua jenis konten
- Produk alur kerja konten yang dibahas secara mendalam di sini hanyalah salah satu komponen penting dalam membentuk masa depan software prosumer
- Segera kami akan membahas lebih detail elemen kedua yang paling penting, yaitu alat produktivitas, sambil meninjau lagi alat yang dipercaya dapat mengalami reinkarnasi serupa di era AI
2 komentar
Saya kira perbedaan produk AI prosumer yang ditawarkan melalui kombinasi workflow memiliki esensi yang sama dengan keterbatasan fundamental platform low-code yang sudah ada.
Tidak semua tugas yang diberikan kepada praktisi memiliki tingkat kompleksitas yang memungkinkan untuk dikendalikan sepenuhnya dengan low-code, karena sering kali kompleksitas tugas itu sendiri cukup tinggi sehingga lebih baik mengendalikan kompleksitas dengan keterampilan pemrograman profesional daripada menyelesaikannya lewat platform low-code. Jika dipersamakan dengan perakitan rangkaian elektronik, solusi low-code berpadanan dengan breadboard. Breadboard memang memungkinkan kita merakit berbagai rangkaian yang dapat berjalan untuk membuat prototipe, tetapi seperti halnya breadboard tidak bisa dipakai untuk membuat sirkuit terpadu yang menuntut keandalan.
Jika ini diterapkan pada pembuatan konten, ada kekhawatiran bahwa karena keterbatasan alat pembuat berbasis AI, kita mungkin tidak bisa mengontrol ketelitian atau detail hasilnya. Seperti gambar AI yang sekarang kadang-kadang tidak mampu menggambar jari dengan benar. Kurva pembelajarannya memang akan menurun, tetapi saya pikir tidak akan sesangat dramatis itu.