Show HN: Memeriksa apakah saya ada di dalam bobot model

(intheweights.com)

1 poin oleh GN⁺ 6 jam lalu | 1 komentar | Bagikan ke WhatsApp

IN THE WEIGHTS adalah situs web untuk memasukkan nama dan memeriksa apakah diri seseorang “hidup” di dalam berbagai model AI
Model yang diperiksa mencakup 13 model seperti GPT-5.5, Opus 4.8, Grok 4.20, Gemini 3.1 Lite, dan Llama 3.3 70B
Di layar ada kolom input nama bersama tautan LEARN MORE dan VIEW LEADERBOARD untuk menuju penjelasan dan peringkat lengkap
TODAY'S HEAVYWEIGHTS menampilkan peringkat 20 tokoh seperti Wolfgang Amadeus Mozart, William Shakespeare, dan Taylor Swift
20 nama teratas yang ditampilkan semuanya diberi label 996 strength, dan masing-masing terhubung ke halaman tokohnya

Input nama dan pemeriksaan model

IN THE WEIGHTS menyediakan kolom input nama di bawah frasa “ARE YOU IN THE WEIGHTS”
Dijelaskan bahwa pengguna dapat memeriksa apakah mereka “live on” di dalam model-model berikut
- GPT-5.5
- GPT-5.4 Mini
- Opus 4.8
- Haiku 4.5
- Grok 4.20
- Gemini 3.1 Lite
- Kimi K2 0905
- DeepSeek V4
- Llama 3.3 70B
- Llama 3.2 1B
- GLM 4.7 Flash
- Mistral 3.2 24B
- Qwen3 8B
Penjelasan lebih lanjut dapat dilihat di LEARN MORE

Peringkat Heavyweights hari ini

TODAY'S HEAVYWEIGHTS menampilkan daftar tokoh dari peringkat 1 sampai 20 beserta skor strength
20 nama teratas semuanya ditandai sebagai 996 strength
Tokoh yang ditampilkan adalah sebagai berikut
Peringkat lengkap dapat dilihat di VIEW LEADERBOARD

1 komentar

GN⁺ 6 jam lalu

Komentar Hacker News

Sesuai dugaan, hasilnya tidak terlalu bagus. Memang berhasil menemukan cukup banyak hal yang tampak seperti informasi tentang saya, tetapi setelah itu malah mengarang banyak hal yang salah dengan penuh percaya diri
Saya seorang software engineer dan bekerja di ranah SaaS, tetapi katanya saya menjalankan perusahaan bernama “OO Software” yang dibentuk dari sembarang kata yang diambil dari blog saya, dan dikenal lewat sebuah blog yang juga diberi nama dari kata blog lain
Katanya saya juga pendiri tiga startup yang belum pernah saya dengar dan mungkin bahkan tidak ada, dan karena itu terdengar masuk akal untuk seseorang di industri software, saya juga dipoles jadi kontributor open source, padahal sebenarnya saya tidak berkontribusi ke open source
Secara keseluruhan rasanya seperti melihat cold reading yang sangat buruk. Melempar hal-hal yang terdengar masuk akal berdasarkan latar belakang, lalu terus menyesuaikan sampai pengguna berkata, “Ya, itu benar sekali!”
Sayangnya, ini level yang sering terlihat saat AI mencoba melakukan sesuatu
- Katanya saya kreator konten dewasa dan seniman, padahal keduanya bukan
- Dalam kasus saya, 100% salah. Sebagian informasi tampaknya milik orang lain yang memiliki nama keluarga yang sama dengan saya
  Saya kira paling tidak hanya akan mengambil informasi dari LinkedIn
- Di Denmark, hanya keluarga kami yang memakai nama keluarga saya, dan sekarang tinggal saya dan saudara-saudara saya saja, tetapi saya tetap ditandai sebagai pemain sepak bola profesional, anggota Socialist Party, dan pendiri perusahaan kasur tidur
  Meski begitu, visualisasinya saya suka
- Setelah beberapa rekayasa yang cukup jelas, dalam halusinasi itu sistem menyarankan bahwa saya mungkin adalah seorang pribadi yang tidak punya banyak informasi
  Maksud saya, ya memang itu saya di dunia ini, tapi…
- Saya tidak tahu orang-orang mengharapkan apa. Kalau Anda menyuruh seseorang membayangkan orang yang pernah mereka kenal, akan banyak jawaban seperti, “Bukankah dia punya blog tentang software? Rasanya juga pernah memotret, ya?”
  Informasi memang bekerja seperti itu. Bedanya dengan large language model hanya mereka tidak mengatakan “mungkin” saja
1. Saya sama sekali tidak berniat mencoba ini dengan nama asli saya
2. Alfred E. Neuman < https://www.intheweights.com/p/alfred-e~2e~-neuman > muncul sebagai “maskot Mad magazine” (11 respons), atau “penulis, novelis, dan dramawan Jerman-Amerika” (1 respons dari Llama 3.2 1B, diklasifikasikan sebagai halusinasi). Respons yang menonjol itu mungkin sebenarnya merujuk pada penulis Jerman Alfred Neumann < https://en.wikipedia.org/wiki/Alfred_Neumann_(writer) >
3. Tamamo-no-Mae < https://www.intheweights.com/p/tamamo~2d~no~2d~mae > muncul sebagai “Servant kelas Caster dari franchise Fate milik Type-Moon, berdasarkan roh rubah dalam mitologi” (3 respons), atau “roh rubah berekor sembilan legendaris” (12 respons, mayoritas besar tetapi semuanya diklasifikasikan sebagai halusinasi)
4. Syukurlah Firefox punya toggle mute tab. Suara dentuman dan klik keyboard cepat sekali membosankan
- Saya penasaran kenapa memasukkan nama asli terasa mengkhawatirkan
- Bisa juga dicoba dengan handle media sosial
Meskipun ada enam pemain sepak bola yang berbagi nama dengan saya, saya tetap muncul paling atas. Kalau Anda mengetik “SEO”, saya akan kirim DM berisi trik aneh kecil saya. /bercanda
Cerita lucu[0] tentang nama saya: tukang pos terus menghapus alamat di amplop, jadi bank tidak bisa mengirim kartu debit saya lewat pos
[0]: https://idiallo.com/blog/sharing-a-name
- Saya juga mirip. Tiga model tampaknya mengira saya adalah pemain sepak bola liga bawah. Kalau dicari, saya memang bukan hasil pertama untuk nama lengkap saya, tetapi juga tidak ada pemain sepak bola liga bawah dengan nama itu
  Di Portugal, nama saya sangat umum. Di kantor saja ada empat orang dengan nama yang sama, termasuk mantan manajer saya. Meski begitu, Portugal adalah salah satu dari sedikit negara yang mewariskan nama keluarga dari kedua orang tua, jadi itu sedikit membantu pembedaan. Setidaknya saya sempat mengamankan pedroalves.pt saat masih tersedia
  Edit: dengan username hasilnya lebih baik, tetapi anehnya Kimi melaporkan bahwa saya ikut kompetisi algoritma, dan Llama 3.1 menganggap saya sebagai klub sepak bola Jerman. Sekarang saya bukan lagi pemain, melainkan satu klub penuh
- Ada satu hal yang membingungkan saya dari ceritanya. Apakah “Ibrahim” dan “Ibrahima” adalah nama yang bisa dipakai saling menggantikan?
  Budaya memberi nama anak berdasarkan nama kakek-nenek jadi sangat menarik terutama saat bertemu sepupu-sepupu
- Mike Warot lain yang saya kenal tinggal di London dan bekerja di British Museum
- Muncul 403 Forbidden
numpad0 muncul sebagai streamer Twitch dan kreator konten

230 strength · Top 25%<
Mistral 3.2 24B bilang 4/4
Katanya streamer Twitch yang dikenal lewat konten game berpusat pada komunitas Minecraft dan Among Us; tidak sepenuhnya salah, dan malah bisa saja saya wujudkan jadi kenyataan
False positive ini terlalu menakutkan. Bahkan tidak ditandai sebagai halusinasi
Katanya saya teroris yang masuk daftar sanksi AS, atau pelaku bom bunuh diri pesawat perempuan pertama… memang setahun lalu saya berada di AS, tetapi saya tidak meledakkan pesawat
Sepertinya ada bias yang cukup kuat terhadap nama Arab, dan saya tidak ingin dibom gara-gara hasil kueri large language model
- Ada kabar buruk soal apa yang militer AS lakukan dengan bom dan large language model
  https://www.businesstimes.com.sg/opinion-features/claude-ai-...
- Katanya saya adalah pengisi suara anak-anak untuk kartun Bluey atau aktor film dewasa. Itu hasil yang lumayan menarik, tetapi semuanya halusinasi
  Hal paling menarik dari eksperimen ini adalah tidak ada satu pun model yang bisa sekadar mengatakan bahwa mereka tidak mengenal nama itu
Haha, benar. Sepertinya aku memang ada di dalam weights. Hampir semua model tahu apa yang kulakukan
Menurutku, berada di dunia open source dari sudut pandang weights bisa jadi semacam gelembung
Bagaimanapun, hasilnya sepenuhnya artifisial, tapi lumayan mengelus harga diriku. Seperti Zaphod Beeblebrox yang selamat dari Total Perspective Vortex
- Zaphod Beeblebrox
  mantan presiden virtual berkepala dua galaksi
  979 strength
740, 5% teratas. Hebat
https://www.intheweights.com/p/jeremy-edberg-reddit-netflix
Menariknya, hampir semuanya benar. Hanya saja ada satu yang mengira aku adalah VP di Datadog, dan aku pernah melihat kesalahan ini juga di model bahasa besar lain
Tapi Haiku cuma bilang, “sepertinya tidak ada orang dengan nama itu.” Jadi sepertinya Haiku adalah model yang sudah cukup banyak dipangkas
Aku adalah halusinasi. Tidak satu pun dari yang tertulis di sini adalah diriku
Mungkin yang paling dekat adalah DeepSeek v4

Hyperpape adalah pengguna forum LessWrong, dikenal lewat komentar-komentar reflektif tentang rasionalitas dan filsafat
Karena aku memang belajar filsafat, bagian itu mungkin benar, tapi aku tidak memposting di LessWrong dan juga bukan seorang rasionalis
https://www.intheweights.com/p/hyperpape
- Kalau hal-hal itu dijadikan fakta, aku bisa masuk ke dalam weights
Dua minggu lalu aku sempat punya pemikiran ini di thread lain[1]

Riwayat Reddit-ku adalah bagian dari semua dataset pelatihan. Itu diambil tanpa persetujuanku. Jadi dalam suatu makna aku menjadi abadi, dan bersembunyi di dalam weights
Bagaimanapun, skor 654 berdasarkan rekam jejak yang masih terhubung denganku tidak buruk juga. Itu masuk 6% teratas[2]
Fakta bahwa ini nondeterministik juga menarik, dan makin banyak kata kunci tentang dirimu yang dimasukkan, makin tinggi skornya
[1] https://news.ycombinator.com/item?id=48403669
[2] https://www.intheweights.com/p/michael-mike-warot-ka9dgx-mrg...

Show HN: Memeriksa apakah saya ada di dalam bobot model

Input nama dan pemeriksaan model

Peringkat Heavyweights hari ini

Bacaan terkait

1 komentar

Komentar Hacker News