1 poin oleh GN⁺ 6 jam lalu | 1 komentar | Bagikan ke WhatsApp
  • IN THE WEIGHTS adalah situs web untuk memasukkan nama dan memeriksa apakah diri seseorang “hidup” di dalam berbagai model AI
  • Model yang diperiksa mencakup 13 model seperti GPT-5.5, Opus 4.8, Grok 4.20, Gemini 3.1 Lite, dan Llama 3.3 70B
  • Di layar ada kolom input nama bersama tautan LEARN MORE dan VIEW LEADERBOARD untuk menuju penjelasan dan peringkat lengkap
  • TODAY'S HEAVYWEIGHTS menampilkan peringkat 20 tokoh seperti Wolfgang Amadeus Mozart, William Shakespeare, dan Taylor Swift
  • 20 nama teratas yang ditampilkan semuanya diberi label 996 strength, dan masing-masing terhubung ke halaman tokohnya

Input nama dan pemeriksaan model

  • IN THE WEIGHTS menyediakan kolom input nama di bawah frasa “ARE YOU IN THE WEIGHTS”
  • Dijelaskan bahwa pengguna dapat memeriksa apakah mereka “live on” di dalam model-model berikut
    • GPT-5.5
    • GPT-5.4 Mini
    • Opus 4.8
    • Haiku 4.5
    • Grok 4.20
    • Gemini 3.1 Lite
    • Kimi K2 0905
    • DeepSeek V4
    • Llama 3.3 70B
    • Llama 3.2 1B
    • GLM 4.7 Flash
    • Mistral 3.2 24B
    • Qwen3 8B
  • Penjelasan lebih lanjut dapat dilihat di LEARN MORE

Peringkat Heavyweights hari ini

1 komentar

 
GN⁺ 6 jam lalu
Komentar Hacker News
  • Sesuai dugaan, hasilnya tidak terlalu bagus. Memang berhasil menemukan cukup banyak hal yang tampak seperti informasi tentang saya, tetapi setelah itu malah mengarang banyak hal yang salah dengan penuh percaya diri
    Saya seorang software engineer dan bekerja di ranah SaaS, tetapi katanya saya menjalankan perusahaan bernama “OO Software” yang dibentuk dari sembarang kata yang diambil dari blog saya, dan dikenal lewat sebuah blog yang juga diberi nama dari kata blog lain
    Katanya saya juga pendiri tiga startup yang belum pernah saya dengar dan mungkin bahkan tidak ada, dan karena itu terdengar masuk akal untuk seseorang di industri software, saya juga dipoles jadi kontributor open source, padahal sebenarnya saya tidak berkontribusi ke open source
    Secara keseluruhan rasanya seperti melihat cold reading yang sangat buruk. Melempar hal-hal yang terdengar masuk akal berdasarkan latar belakang, lalu terus menyesuaikan sampai pengguna berkata, “Ya, itu benar sekali!”
    Sayangnya, ini level yang sering terlihat saat AI mencoba melakukan sesuatu

    • Katanya saya kreator konten dewasa dan seniman, padahal keduanya bukan
    • Dalam kasus saya, 100% salah. Sebagian informasi tampaknya milik orang lain yang memiliki nama keluarga yang sama dengan saya
      Saya kira paling tidak hanya akan mengambil informasi dari LinkedIn
    • Di Denmark, hanya keluarga kami yang memakai nama keluarga saya, dan sekarang tinggal saya dan saudara-saudara saya saja, tetapi saya tetap ditandai sebagai pemain sepak bola profesional, anggota Socialist Party, dan pendiri perusahaan kasur tidur
      Meski begitu, visualisasinya saya suka
    • Setelah beberapa rekayasa yang cukup jelas, dalam halusinasi itu sistem menyarankan bahwa saya mungkin adalah seorang pribadi yang tidak punya banyak informasi
      Maksud saya, ya memang itu saya di dunia ini, tapi…
    • Saya tidak tahu orang-orang mengharapkan apa. Kalau Anda menyuruh seseorang membayangkan orang yang pernah mereka kenal, akan banyak jawaban seperti, “Bukankah dia punya blog tentang software? Rasanya juga pernah memotret, ya?”
      Informasi memang bekerja seperti itu. Bedanya dengan large language model hanya mereka tidak mengatakan “mungkin” saja
    1. Saya sama sekali tidak berniat mencoba ini dengan nama asli saya
    2. Alfred E. Neuman < https://www.intheweights.com/p/alfred-e~2e~-neuman > muncul sebagai “maskot Mad magazine” (11 respons), atau “penulis, novelis, dan dramawan Jerman-Amerika” (1 respons dari Llama 3.2 1B, diklasifikasikan sebagai halusinasi). Respons yang menonjol itu mungkin sebenarnya merujuk pada penulis Jerman Alfred Neumann < https://en.wikipedia.org/wiki/Alfred_Neumann_(writer) >
    3. Tamamo-no-Mae < https://www.intheweights.com/p/tamamo~2d~no~2d~mae > muncul sebagai “Servant kelas Caster dari franchise Fate milik Type-Moon, berdasarkan roh rubah dalam mitologi” (3 respons), atau “roh rubah berekor sembilan legendaris” (12 respons, mayoritas besar tetapi semuanya diklasifikasikan sebagai halusinasi)
    4. Syukurlah Firefox punya toggle mute tab. Suara dentuman dan klik keyboard cepat sekali membosankan
    • Saya penasaran kenapa memasukkan nama asli terasa mengkhawatirkan
    • Bisa juga dicoba dengan handle media sosial
  • Meskipun ada enam pemain sepak bola yang berbagi nama dengan saya, saya tetap muncul paling atas. Kalau Anda mengetik “SEO”, saya akan kirim DM berisi trik aneh kecil saya. /bercanda
    Cerita lucu[0] tentang nama saya: tukang pos terus menghapus alamat di amplop, jadi bank tidak bisa mengirim kartu debit saya lewat pos
    [0]: https://idiallo.com/blog/sharing-a-name

    • Saya juga mirip. Tiga model tampaknya mengira saya adalah pemain sepak bola liga bawah. Kalau dicari, saya memang bukan hasil pertama untuk nama lengkap saya, tetapi juga tidak ada pemain sepak bola liga bawah dengan nama itu
      Di Portugal, nama saya sangat umum. Di kantor saja ada empat orang dengan nama yang sama, termasuk mantan manajer saya. Meski begitu, Portugal adalah salah satu dari sedikit negara yang mewariskan nama keluarga dari kedua orang tua, jadi itu sedikit membantu pembedaan. Setidaknya saya sempat mengamankan pedroalves.pt saat masih tersedia
      Edit: dengan username hasilnya lebih baik, tetapi anehnya Kimi melaporkan bahwa saya ikut kompetisi algoritma, dan Llama 3.1 menganggap saya sebagai klub sepak bola Jerman. Sekarang saya bukan lagi pemain, melainkan satu klub penuh
    • Ada satu hal yang membingungkan saya dari ceritanya. Apakah “Ibrahim” dan “Ibrahima” adalah nama yang bisa dipakai saling menggantikan?
      Budaya memberi nama anak berdasarkan nama kakek-nenek jadi sangat menarik terutama saat bertemu sepupu-sepupu
    • Mike Warot lain yang saya kenal tinggal di London dan bekerja di British Museum
    • Muncul 403 Forbidden
  • numpad0 muncul sebagai streamer Twitch dan kreator konten

    230 strength · Top 25%<
    Mistral 3.2 24B bilang 4/4
    Katanya streamer Twitch yang dikenal lewat konten game berpusat pada komunitas Minecraft dan Among Us; tidak sepenuhnya salah, dan malah bisa saja saya wujudkan jadi kenyataan

  • False positive ini terlalu menakutkan. Bahkan tidak ditandai sebagai halusinasi
    Katanya saya teroris yang masuk daftar sanksi AS, atau pelaku bom bunuh diri pesawat perempuan pertama… memang setahun lalu saya berada di AS, tetapi saya tidak meledakkan pesawat
    Sepertinya ada bias yang cukup kuat terhadap nama Arab, dan saya tidak ingin dibom gara-gara hasil kueri large language model

    • Ada kabar buruk soal apa yang militer AS lakukan dengan bom dan large language model
      https://www.businesstimes.com.sg/opinion-features/claude-ai-...
    • Katanya saya adalah pengisi suara anak-anak untuk kartun Bluey atau aktor film dewasa. Itu hasil yang lumayan menarik, tetapi semuanya halusinasi
      Hal paling menarik dari eksperimen ini adalah tidak ada satu pun model yang bisa sekadar mengatakan bahwa mereka tidak mengenal nama itu
  • Haha, benar. Sepertinya aku memang ada di dalam weights. Hampir semua model tahu apa yang kulakukan
    Menurutku, berada di dunia open source dari sudut pandang weights bisa jadi semacam gelembung
    Bagaimanapun, hasilnya sepenuhnya artifisial, tapi lumayan mengelus harga diriku. Seperti Zaphod Beeblebrox yang selamat dari Total Perspective Vortex

    • Zaphod Beeblebrox
      mantan presiden virtual berkepala dua galaksi
      979 strength
  • 740, 5% teratas. Hebat
    https://www.intheweights.com/p/jeremy-edberg-reddit-netflix
    Menariknya, hampir semuanya benar. Hanya saja ada satu yang mengira aku adalah VP di Datadog, dan aku pernah melihat kesalahan ini juga di model bahasa besar lain
    Tapi Haiku cuma bilang, “sepertinya tidak ada orang dengan nama itu.” Jadi sepertinya Haiku adalah model yang sudah cukup banyak dipangkas

  • Aku adalah halusinasi. Tidak satu pun dari yang tertulis di sini adalah diriku
    Mungkin yang paling dekat adalah DeepSeek v4

    Hyperpape adalah pengguna forum LessWrong, dikenal lewat komentar-komentar reflektif tentang rasionalitas dan filsafat
    Karena aku memang belajar filsafat, bagian itu mungkin benar, tapi aku tidak memposting di LessWrong dan juga bukan seorang rasionalis
    https://www.intheweights.com/p/hyperpape

    • Kalau hal-hal itu dijadikan fakta, aku bisa masuk ke dalam weights
  • Dua minggu lalu aku sempat punya pemikiran ini di thread lain[1]

    Riwayat Reddit-ku adalah bagian dari semua dataset pelatihan. Itu diambil tanpa persetujuanku. Jadi dalam suatu makna aku menjadi abadi, dan bersembunyi di dalam weights
    Bagaimanapun, skor 654 berdasarkan rekam jejak yang masih terhubung denganku tidak buruk juga. Itu masuk 6% teratas[2]
    Fakta bahwa ini nondeterministik juga menarik, dan makin banyak kata kunci tentang dirimu yang dimasukkan, makin tinggi skornya
    [1] https://news.ycombinator.com/item?id=48403669
    [2] https://www.intheweights.com/p/michael-mike-warot-ka9dgx-mrg...