4 poin oleh GN⁺ 2025-11-07 | 1 komentar | Bagikan ke WhatsApp
  • OpenPCC adalah framework inferensi AI privat yang dapat diverifikasi yang terinspirasi dari Private Cloud Compute milik Apple, dan tersedia sepenuhnya sebagai open source
  • Menjamin perlindungan data pribadi melalui streaming terenkripsi, hardware attestation, dan unlinkable requests tanpa mengekspos prompt, output, maupun log
  • Siapa pun dapat menjalankan model AI terbuka atau kustom di infrastruktur mereka sendiri, dengan desain yang transparan dan dapat diaudit
  • Confident Security sedang mengembangkan layanan terkelola CONFSEC berdasarkan standar OpenPCC
  • Bertujuan berkembang menjadi standar yang digerakkan komunitas untuk privasi data AI

Gambaran Umum OpenPCC

  • OpenPCC adalah framework open source yang memungkinkan inferensi AI dengan privasi terjamin
    • Berdasarkan konsep Private Cloud Compute milik Apple, tetapi diimplementasikan dalam bentuk yang sepenuhnya terbuka, dapat diaudit, dan dapat di-deploy sendiri
    • Pengguna dapat menjalankan model AI tanpa prompt, output, atau log terekspos ke pihak luar
  • Memperkuat perlindungan data melalui streaming terenkripsi, hardware attestation, dan unlinkable requests
  • Tujuannya adalah membangun standar privasi data AI yang transparan dan dikelola komunitas

Managed Service: CONFSEC

  • Confident Security sedang mengembangkan layanan terkelola penuh CONFSEC berdasarkan standar OpenPCC
    • Informasi terkait dan pendaftaran tersedia di situs confident.security
    Iklan
  • CONFSEC membantu agar teknologi OpenPCC dapat dimanfaatkan dengan mudah di lingkungan komersial

Komponen OpenPCC Client

  • Repositori ini mencakup kode klien Go dan library C, yang digunakan sebagai dasar untuk klien Python dan JavaScript
  • Juga disediakan in-memory services untuk menguji klien
  • Implementasi Compute Node terkait dapat dilihat di repositori terpisah (confidentsecurity/confidentcompute)

Contoh Penggunaan Go

  • Contoh pengembangan lokal disertakan dalam file cmd/test-client/main.go
  • Saat terhubung ke layanan produksi, klien dibuat melalui openpcc.NewFromConfig lalu melakukan permintaan API
    • Dalam contoh, digunakan model "qwen3:1.7b" dan prompt "why is the sky blue?"
    • Header permintaan "X-Confsec-Node-Tags" digunakan untuk merutekan ke compute node yang menjalankan model tertentu
  • Contoh kode mengikuti format generate dari OpenAI API
Iklan

Pengembangan dan Pengujian

  • Perintah pengembangan menggunakan alat build berbasis Go, mage
    • Dapat dijalankan dengan go tool mage [cmd] atau go install github.com/magefile/mage@latest
    • Perintah mage menampilkan daftar command yang tersedia, yang didefinisikan di direktori /magefiles/*
  • Untuk menguji library selama pengembangan, jalankan in-memory OpenPCC service dengan mage runMemServices, lalu lakukan permintaan uji dengan mage runClient

Referensi

1 komentar

 
GN⁺ 2025-11-07
Opini Hacker News
  • Dari isi whitepaper, tampaknya inference provider masih memiliki akses ke prompt dan respons dalam bentuk plaintext
    Namun pendekatan ini tetap mencegah pihak ketiga seperti API router melihat plaintext, dan juga menyembunyikan identitas klien agar tidak dapat dikaitkan dengan permintaan
    Akan bagus jika README merangkum dengan jelas cakupan jaminan privasi seperti ini
    Dengan mempertimbangkan hal tersebut, saya jadi penasaran apa keunggulan arsitektur ini dibanding sekadar pengguna

    • mengirim permintaan langsung ke inference provider tanpa router perantara

    • membayar dengan kripto anonim

    • menyembunyikan IP dengan VPN

    • Saya adalah engineering lead di confident.security, dan senang melihat proyek ini dirilis
      Saya penasaran apa yang tepatnya dimaksud dengan inference provider di sini
      Dalam praktiknya, setelah didekripsi, workload tetap tidak keluar ke pihak eksternal seperti OpenAI, melainkan dijalankan langsung pada mesin komputasi yang memuat model open source
      Mesin-mesin ini membuktikan secara kriptografis (attestation) perangkat lunak yang sedang berjalan, dan menjamin bahwa informasi sensitif tidak bisa dibocorkan ke luar
      PCC milik Apple juga bekerja dengan prinsip yang sama, dan klien tidak akan mengirim permintaan ke node yang tidak memberikan jaminan seperti itu
      Jadi, jaminan privasi utamanya adalah bahkan operator hardware pun tidak bisa melihat prompt

    • Banyak orang meremehkan fakta bahwa penyedia tetap bisa mengakses plaintext prompt
      BYOK menyelesaikan sebagian besar masalah, tetapi tetap ada risiko saat kunci diberikan
      Sistem seperti Private Cloud Compute milik Apple atau Nitro Enclaves dari AWS berusaha menyelesaikan tahap terakhir ini
      Hasil verifikasi NCC Group terhadap AWS menunjukkan bahwa tidak ada API administratif yang memungkinkan karyawan login ke host atau mengakses data pelanggan
      Arsitektur seperti ini sangat tidak biasa dari sisi transparansi dan keamanan
      Blog riset keamanan PCC dari Apple juga layak dibaca

    • Kalau begitu, tampaknya lebih sederhana menjalankan model lokal sendiri, meskipun performanya sedikit lebih rendah

    • Di UE, kemungkinan besar ilegal bagi perusahaan untuk menerima pembayaran kripto anonim
      Karena aturan anti pencucian uang, hanya pembayaran yang dapat dilacak yang diizinkan
      Namun belum jelas sampai tingkat mana larangan itu berlaku
      Artikel terkait: EU to ban trading of privacy coins from 2027

  • Saya juga pernah berada di tim yang mengerjakan hal serupa
    Ini layanan berbayar, tetapi menyediakan source available dan attestation yang bermakna
    Layanan: privatemode.ai
    Kode: github.com/edgelesssys/privatemode-public

    • OpenPCC berlisensi Apache 2.0 dan mencegah rugpull tanpa CLA
      Sementara edgeless menggunakan BSL
    • Intinya adalah attestation
      USP-nya adalah membuat inference provider tidak bisa melihat prompt,
      dan Privatemode mencapainya melalui rantai source code → reproducible build → laporan attestation TEE
      Mereka juga memperkuat keamanan dengan teknologi isolasi seperti Kata/CoCo dan kebijakan runtime
  • Disebut “provably private”, tetapi dengan akses fisik dan sedikit peralatan, bus memori tetap bisa dianalisis
    Diskusi terkait: thread HN

    • GCP melakukan live migration pada confidential VM
      Dari puluhan ribu mesin, ke mana Anda akan memasang analyzer?
    • Lagi pula, serangan seperti itu membutuhkan waktu tak terbatas dan akses fisik
  • Rilis yang keren. Fakta bahwa ini dibuka sebagai open source juga mengesankan
    Kami sedang meneliti tantangan yang mirip dengan masalah homomorphic encryption, dan saya penasaran apakah OpenPCC bisa membantu
    Misalnya, saat perangkat wearable seperti kacamata AR mencatat data visual, muncul persoalan privasi
    Apakah OpenPCC bisa dipakai untuk menganonimkan data tersebut demi debugging pengembang?

    • Bisa. Anda dapat menjalankan workload anonimisasi di dalam node OpenPCC
      Pada dasarnya, OpenPCC adalah server HTTP yang telah di-attest dan isi internalnya tidak dapat dilihat
      Jika wearable mengirim data ke OpenPCC, proses anonimisasi dapat dijalankan di dalamnya
      Tentu saja, menganonimkan langsung di perangkat itu sendiri lebih sederhana
      Sebagai catatan, homomorphic encryption masih belum praktis
  • Rilis yang benar-benar keren
    Semoga lebih banyak perusahaan memanfaatkannya untuk memperkuat privasi pengguna

  • Senang melihat bahasa Go muncul
    Menurut saya, Go akan melampaui Python di bidang AI

  • Mirip dengan Confidential AI Inference milik Azure
    Tautan referensi: Azure AI Confidential Inferencing Deep Dive

    • Tetapi saya tidak bisa menemukan source code mereka
      Itu bagian yang penting dari sisi transparansi; penasaran apakah ada yang pernah melihatnya
  • Secara teori ini keren, tetapi saya belum yakin apa yang benar-benar bisa dijalankan
    Selain spammer, use case apa yang ada?
    Yang terlintas adalah federated learning atau sistem pembelajaran terdistribusi seperti FlowerLLM, tetapi itu bukan untuk inference
    Saya menyambut upaya keluar dari software tertutup, tetapi penasaran dengan contoh penggunaan nyata

    • Akan bagus jika ada contoh yang konkret
      Misalnya, mungkin OpenAI Whisper bisa dijalankan di /e/OS sebagai layanan STT melalui proxy anonim
      Tetapi untuk tingkat seperti itu, semuanya juga cukup memungkinkan secara lokal, jadi saya masih mencari use case yang benar-benar jelas
  • Saya penasaran di mana source code untuk compute node berada