◀ Tahun sebelumnya | ◁ Bulan sebelumnya | << Minggu sebelumnya | < Hari sebelumnya | 2026-02-18 | Hari berikutnya > | Minggu berikutnya >> | Bulan berikutnya ▷ 21 SkillsBench: benchmark untuk mengevaluasi performa skill agen di berbagai tugas (arxiv.org) SkillsBench adalah benchmark pertama yang mengukur dampak skill agen LLM di 84 tugas lintas 11 domain dan menemukan bahwa skill terkurasi meningkatkan performa rata-rata 16,2 poin persentase. 3 poin oleh GN⁺ 2026-02-18 | 1 komentar 22 Kebangkitan Triforce (dolphin-emu.org) Dolphin kini mendukung emulasi penuh Triforce, platform arcade berbasis GameCube hasil kolaborasi Nintendo, Sega, dan Namco, termasuk fitur khas seperti Segaboot, JVS I/O, dan jaringan multi-cabinet. 5 poin oleh GN⁺ 2026-02-18 | 2 komentar