https://github.com/modulabs-personalab/psyctl

Ini adalah library terkait. Ada contoh penerapan di Google Colab, jadi cocok untuk eksperimen cepat.

 
iolothebard 1 jam lalu | induk | di: Langganan AI adalah bom waktu bagi enterprise (thestateofbrand.com)

Pada akhirnya akan tetap dipakai.
Dulu iPhone 3 harganya sekitar 200~300 dolar… sekarang sudah jauh melewati 1000 dolar, tapi tetap dipakai. Sudah telanjur merasakan enaknya.

 
╭────────────────────────────────────────────────────── Hardware Info ───────────────────────────────────────────────────────╮  
│ GPU 0: Strix Halo [Radeon Graphics / Radeon 8050S Graphics / Radeon 8060S Graphics] — memori bersama — BW: 256 GB/s      │  
│ CPU: AMD RYZEN AI MAX+ 395 w/ Radeon 8060S — 16 core (AVX2, AVX-512)                                                      │  
│ RAM: 117.5 GB                                                                                                              │  
│ Disk kosong: 174.1 GB                                                                                                      │  
│ OS: linux                                                                                                                  │  
╰────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────╯  
  
                                                Model yang Direkomendasikan  
┏━━━━━┳━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━┳━━━━━━━━┳━━━━━━━━┳━━━━━━━━━━━━┳━━━━━━━━━━━┳━━━━━━━┳━━━━━━━━━━┓  
┃   # ┃ Model                                     ┃ Params ┃ Quant  ┃ Diterbitkan┃ Unduhan   ┃ Skor  ┃ Lisensi  ┃  
┡━━━━━╇━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━╇━━━━━━━━╇━━━━━━━━╇━━━━━━━━━━━━╇━━━━━━━━━━━╇━━━━━━━╇━━━━━━━━━━┩  
│   1 │ Qwen/Qwen3-Next-80B-A3B-Instruct          │  81.3B │  Q6_K  │ 2025-09-09 │    336.2K │  94.9 │ apache-… │  
│     │                                           │ (3.0B… │        │            │           │       │          │  
├─────┼───────────────────────────────────────────┼────────┼────────┼────────────┼───────────┼───────┼──────────┤  
│   2 │ openai/gpt-oss-120b                       │ 120.4B │  Q6_K  │ 2025-08-04 │      4.7M │  91.9 │ apache-… │  
│     │                                           │ (5.1B… │        │            │           │       │          │  
├─────┼───────────────────────────────────────────┼────────┼────────┼────────────┼───────────┼───────┼──────────┤  
│   3 │ Qwen/Qwen3.6-27B                          │  27.8B │ Q3_K_M │ 2026-04-21 │      3.6M │  85.1 │ apache-… │  
├─────┼───────────────────────────────────────────┼────────┼────────┼────────────┼───────────┼───────┼──────────┤  
│   4 │ Qwen/Qwen3-30B-A3B                        │  30.0B │  Q6_K  │ 2025-04-27 │      1.7M │  83.5 │ apache-… │  
│     │                                           │ (3.0B… │        │            │           │       │          │  
├─────┼───────────────────────────────────────────┼────────┼────────┼────────────┼───────────┼───────┼──────────┤  
│   5 │ google/gemma-4-26B-A4B-it                 │  26.5B │  Q6_K  │ 2026-03-11 │      8.7M │  81.2 │ apache-… │  
│     │                                           │ (3.8B… │        │            │           │       │          │  
├─────┼───────────────────────────────────────────┼────────┼────────┼────────────┼───────────┼───────┼──────────┤  
│   6 │ openai/gpt-oss-20b                        │  21.5B │  Q6_K  │ 2025-08-04 │      7.6M │  77.9 │ apache-… │  
│     │                                           │ (3.6B… │        │            │           │       │          │  
├─────┼───────────────────────────────────────────┼────────┼────────┼────────────┼───────────┼───────┼──────────┤  
│   7 │ zai-org/GLM-4.7-Flash                     │  31.2B │  Q6_K  │ 2026-01-19 │    742.3K │  77.2 │ mit      │  
│     │                                           │ (12.0… │        │            │           │       │          │  
├─────┼───────────────────────────────────────────┼────────┼────────┼────────────┼───────────┼───────┼──────────┤  
│   8 │ zai-org/GLM-4.5-Air                       │ 110.5B │  Q6_K  │ 2025-07-20 │    384.2K │  75.6 │ mit      │  
│     │                                           │ (12.0… │        │            │           │       │          │  
├─────┼───────────────────────────────────────────┼────────┼────────┼────────────┼───────────┼───────┼──────────┤  
│   9 │ meta-llama/Llama-4-Scout-17B-16E-Instruct │ 109.0B │ Q5_K_M │ 2025-04-02 │    391.1K │  74.7 │ other    │  
│     │                                           │ (17.0… │        │            │           │       │          │  
├─────┼───────────────────────────────────────────┼────────┼────────┼────────────┼───────────┼───────┼──────────┤  
│  10 │ Qwen/Qwen3-32B                            │  32.0B │ Q5_K_M │ 2025-04-27 │      7.0M │  73.9 │ apache-… │  
└─────┴───────────────────────────────────────────┴────────┴────────┴────────────┴───────────┴───────┴──────────┘  
  Tingkat keyakinan pilihan teratas: Tinggi (benchmark langsung, selisih +2.9)  
  Referensi benchmark: snapshot kurasi 2026-05; live AA / LiveBench / Aider digabungkan saat dapat diakses.  
 

Bukankah jadi sedikit lebih baik setelah diubah menjadi zero-config?

 

Terima kasih atas tulisannya yang bagus.

 
prunusnira 7 jam lalu | induk | di: Langganan AI adalah bom waktu bagi enterprise (thestateofbrand.com)

Sepertinya pembangunan LLM lokal akan semakin banyak dilakukan.

 

Saya rasa komunikasi internal adalah hal yang paling penting.

 

Saya rasa ini akan sangat bagus jika digunakan bersama compound engineering

 
hmmhmmhm 11 jam lalu | induk | di: Langganan AI adalah bom waktu bagi enterprise (thestateofbrand.com)

Sepertinya ini isu yang sama seperti pada era mainframe..
Jika terbentuk kondisi bahwa server mahal dan sumber daya terbatas, sementara komputer pribadi lambat,
pada akhirnya server juga akan menjadi lebih murah dan performa komputer pribadi juga meningkat... sepertinya waktu yang akan menjawab.

 

Banyak alat harness yang sedang naik daun, tetapi sulit memahami kelebihan dan kekurangan masing-masing. Apa perbedaannya dengan ouroboros?

 
aer0700 12 jam lalu | induk | di: Langganan AI adalah bom waktu bagi enterprise (thestateofbrand.com)

Karena berpikir orang tetap akan memakainya meski mahal, para penyedia LLM kemungkinan menaikkan harga. Saya jadi penasaran bagaimana nasib LLM open source seperti GLM, qwen, dan deepseek ke depannya. Orang-orang akan mulai menghitung, apakah harus membayar harga ini untuk memakai model frontier, atau justru lebih masuk akal memakai open source meski harus bersusah payah membangun infrastruktur vLLM sendiri.

 

Entire - platform developer baru untuk agen AI

> Perusahaan yang didirikan oleh mantan CEO GitHub, Thomas Dohmke

 
master6559 12 jam lalu | induk | di: Langganan AI adalah bom waktu bagi enterprise (thestateofbrand.com)

Kalau mahal, ya tidak usah dipakai..

 

Riwayat orang ini menarik, belajar dari jurusan psikologi lewat kuliah data science Coursera
lalu bergabung pada masa awal Lazada, yang pernah dijuluki Amazon-nya Asia Tenggara, dan naik jabatan sampai menjadi VP.
Lazada kemudian diakuisisi oleh Alibaba.
Setelah itu pindah ke Amazon sebagai principal scientist untuk rekomendasi/LLM.
Sekarang menjadi technical staff di Anthropic

 

Ini mengingatkan saya pada hal serupa, yaitu mengukur kinerja hanya berdasarkan jam kerja juga wkwk
Meski tidak ada hasil, kalau sering lembur tetap mendapat penilaian tinggi hehe

 

Tapi ini adalah postingan dari subreddit codex, jadi perlu dibaca dengan sedikit mempertimbangkan konteks itu. Di Reddit, tingkat sikap terlalu memuja(?) bisa sangat berbeda tergantung subredditnya.

 
dennissong 14 jam lalu | induk | di: Pengalaman Kini Menjadi Pajak (x.com/JayaGup10)

Soal AI, ada banyak tulisan yang membahas dengan membagi antara junior vs. senior, tapi entah kenapa semuanya terasa canggung.

Rasanya seperti mengabaikan esensi persoalan dan sengaja menciptakan konflik hanya untuk dijadikan bahan pembicaraan.

 

Pada suatu titik, codex tampaknya jauh lebih unggul dalam banyak hal.

 

Saya merekomendasikan 5 model seperti ini. Ternyata 3 di antaranya adalah Qwen.

Qwen/Qwen3-Next-80B-A3B-Instruct
Qwen/Qwen3.6-27B
deepseek-ai/DeepSeek-V4-Flash
openai/gpt-oss-120b
Qwen/Qwen3-235B-A22B