Model frontier OpenAI dan Codex kini tersedia di AWS
(openai.com)- Model frontier OpenAI dan Codex kini tersedia secara umum di AWS, sehingga jutaan pelanggan AWS dapat membangun dengan OpenAI di platform tempat mereka sudah menjalankan bisnis
- Perusahaan dapat menghadirkan AI frontier ke produksi melalui alur kerja keamanan, kepatuhan, pengadaan, penagihan, dan tata kelola yang sudah ada, sehingga mengurangi hambatan dari evaluasi hingga penerapan nyata
- OpenAI models on Amazon Bedrock memungkinkan pembangunan aplikasi AI dengan kontrol keamanan dan tata kelola native AWS
- Codex on Amazon Bedrock menghadirkan agen rekayasa perangkat lunak OpenAI yang digunakan lebih dari 5 juta orang setiap minggu ke lingkungan AWS untuk membantu penulisan kode, review, debugging, dan modernisasi
- Ke depan, ini akan diperluas dengan menghadirkan Daybreak kepada pelanggan AWS untuk memasukkan review kode keamanan, threat modeling, verifikasi patch, analisis risiko dependensi, deteksi, dan panduan perbaikan ke dalam loop pengembangan sehari-hari
Menghadirkan OpenAI ke produksi di AWS
- Model frontier OpenAI dan Codex kini tersedia secara umum di AWS
- Pelanggan AWS dapat menggunakan kemampuan OpenAI melalui platform AWS yang sudah mereka gunakan untuk menjalankan bisnis
- Hambatan utama perusahaan seperti keamanan, kepatuhan, pengadaan, penagihan, dan prosedur tata kelola dapat ditangani dalam alur kerja yang ada
- Organisasi dapat mengurangi hambatan operasional dan berpindah lebih cepat dari tahap evaluasi ke penerapan nyata
Cara penyediaan dan rencana ekspansi
- OpenAI models on Amazon Bedrock memungkinkan pembuatan aplikasi AI dengan kontrol keamanan dan tata kelola native AWS
- Codex on Amazon Bedrock disediakan sebagai agen rekayasa perangkat lunak yang membantu tim menulis kode, melakukan review, debugging, dan modernisasi di lingkungan AWS tempat mereka sudah membangun dan menerapkan
- Kedua opsi ini tersedia di region AWS Commercial dan GovCloud
- OpenAI dan AWS berencana terus memperluas kemampuan OpenAI yang disediakan melalui AWS agar tim dapat bergerak dari evaluasi ke produksi dengan hambatan lebih kecil dan keyakinan lebih tinggi
- Daybreak yang akan datang mencakup model siber dan Codex Security, yang dirancang agar para pembela siber dapat melihat risiko lebih awal, merespons lebih cepat, dan membuat perangkat lunak lebih tangguh
1 komentar
Komentar Hacker News
Setiap kali melihat orang bertanya kenapa ada yang mempercayai AWS, Azure, GCP, dan semacamnya, dan kenapa mau membayar premium, rasanya jelas mereka belum pernah bekerja di lingkungan enterprise
Perusahaan besar tempat saya bekerja punya tata kelola data yang ketat dalam kontrak pelanggan, dan juga punya persyaratan governance internal sendiri. Menggunakan vendor yang bukan hanya lolos persetujuan keamanan informasi, tetapi juga secara kontraktual tercantum sebagai pemroses data dalam kontrak pelanggan, adalah cara untuk menghindari pemecatan dan gugatan
Kalau di rumah bermain-main dengan kode dan data pribadi, ya silakan pakai apa saja. Tapi untuk data perusahaan dan pelanggan, itu sama sekali tidak boleh. Alasan yang sama juga menjelaskan kenapa kami tidak sembarang memakai frontier model terbaru yang sedang tren. Side project dan startup punya batasan serta pertimbangan yang benar-benar berbeda
Kalau membaca tulisan kecilnya, cukup menarik. Tanggung jawab atas kehilangan data umumnya ada di pelanggan, klaim SLA harus disertai bukti yang spesifik, dan bentuk pemulihan yang diterima biasanya hanyalah kredit penggunaan di masa depan untuk produk yang justru kehilangan data tersebut
Dibandingkan tempat seperti GCP, ketentuan AWS justru cukup masuk akal. SLA GCP tampaknya terutama berguna agar tim pembelian enterprise bisa berkata, “Ada SLA, jadi kami sudah melakukan due diligence, dan memilih ini seharusnya tidak akan membuat kami dipecat.” Di sisi lain, GCP bisa bilang, “Saat menandatangani kontrak, Anda sudah menerima upaya pemulihan yang kami usulkan, jadi kalau Anda menggugat, kami akan menunjukkan klausul itu. Terima kasih sudah percaya pada kami.” [0]
[0] https://docs.cloud.google.com/storage/docs/storage-classes
Penyimpanan standard multi-region atau dual-region memiliki SLA ketersediaan 99,95%, regional standard 99,9%, dan regional Nearline, Coldline, Archive bisa turun sampai 99,0%. Kreditnya sebesar 10%, 25%, atau 50% dari tagihan bulanan kelas layanan yang terdampak, batas gabungan per bulan adalah 50%, dan diterapkan untuk penggunaan berikutnya. Google juga menyatakan bahwa jika pelanggan tidak meminta kredit dalam 30 hari, itu dianggap hangus
AWS juga bisa diretas, tetapi mereka sudah berupaya menurunkan kemungkinan itu sedikit dan mempermudah pelacakan pelanggan mana yang terdampak. Misalnya, kalau Anda menyelami logging AWS, hanya dengan mengaktifkannya saja sudah tercatat sangat banyak hal, sehingga Anda bisa menelusuri siapa melakukan apa terhadap izin atau lingkungan. Akses karyawan AWS juga tampaknya dicatat cukup baik. Dulu, untuk menempelkan staf AWS ke akun saya, ada banyak prosedur yang harus dilalui
Saya kaget mengetahui betapa sulitnya menggunakan satu lisensi GitHub Copilot di Azure. Padahal keduanya sama-sama produk Microsoft, tetapi IT tetap harus mencari tahu berbagai hal seperti menyiapkan GitHub Enterprise dan menghubungkannya ke subscription Azure
Kalau pernah memakai model coding AI di lingkungan perusahaan besar, Anda pasti tahu bahwa banyak deployment perusahaan besar pada praktiknya mengharuskan penggunaan AWS Bedrock. Alasannya sederhana
Kami tidak bekerja di AS, dan punya persyaratan kuat bahwa data harus tetap berada di negara kami, dan Bedrock menyediakan kontrol itu
Kalau arahnya seperti ini, saya jadi penasaran bagaimana AI akan terus berkembang ke depan. Jika kita mengasumsikan sebagian besar data yang bernilai berada di balik firewall seperti ini, berarti data publik sudah dipanen, dan mungkin juga sudah dilatih di atas data yang diperoleh secara tidak sah. Bagian ini area abu-abu
Apakah pada akhirnya akan menjadi ekosistem tertutup tanpa input eksternal?
Kalau Anda bertanya kenapa orang rela membayar lebih untuk API ini lewat AWS alih-alih memakainya langsung, alasannya adalah di sebagian perusahaan, mendapatkan persetujuan vendor baru itu nyaris mustahil. Kalau perusahaan sudah punya kontrak AWS, maka yang dipakai adalah apa yang ditawarkan AWS
Bergantung pada kontrak pelanggan, Anda mungkin juga harus memberi tahu pelanggan tentang vendor baru itu, dan ini bisa memicu tinjauan keamanan baru. Tapi kalau hanya menambah satu model lagi ke Bedrock? Jauh lebih mudah
Ini kabar besar bagi OpenAI. Ada jauh lebih banyak enterprise yang memilih Claude hanya karena bisa dipakai di AWS daripada yang dibayangkan banyak orang, dan sekarang muncul persaingan yang serius
Ini langkah yang bagus untuk OpenAI dan sesuatu yang perlu dikhawatirkan Anthropic. Karena ketergantungan pada AWS dan persyaratan keamanan, selama beberapa waktu Bedrock adalah satu-satunya cara saya bisa memakai foundation model
Mereka mungkin tidak senang kehilangan keuntungan sebagai yang datang lebih dulu, tetapi tampaknya ini sesuatu yang sudah mereka perkirakan sejak lama
Ini kabar baik untuk persaingan
Claude Code terus menahan fitur-fitur baru dari orang yang memakainya lewat Amazon Bedrock. Misalnya auto mode, paket Ultra, dan Claude for Chrome. Kalau persaingan bertambah sedikit lagi, mungkin mereka akan memikirkan ulang strateginya
Selama beberapa waktu saya membuat emulator api.anthropic.com dan “diam-diam” meneruskan request ke Amazon Bedrock. Itu berjalan baik, dan sekarang fitur yang tadinya eksklusif untuk penyedia pihak pertama juga bisa langsung dipakai
Anthropic tampaknya perlu segera IPO. Lonjakan pendapatan yang sangat besar itu pada dasarnya adalah hasil dari gagalnya peluncuran Gemini dan OpenAI yang terikat ke Azure sehingga geraknya terbatas
Model Anthropic secara harfiah adalah satu-satunya API serverless yang praktis dan tersedia di AWS, yaitu model Bedrock. Belakangan mereka bahkan belum merilis lini Qwen 3.5/3.6. Ditambah tren yang berfokus pada efisiensi token dan ROI, saya benar-benar ingin melihat bagaimana Anthropic menutup kuartal ketiganya
Lab frontier menyediakan build model beku di mana hyperscaler hanya melayani inferensi tanpa mengumpulkan data. Bagi kebanyakan perusahaan yang ingin memakai frontier LLM sambil tetap menyimpan data sensitif, ini adalah prasyarat
Ini buruk untuk Azure. Mereka dulu pihak yang terpilih, tetapi gagal mengikuti permintaan
Saat OpenAI keluar dari kontrak eksklusif karena Azure tidak stabil, saya tahu tujuan berikutnya adalah AWS