2 poin oleh GN⁺ 2024-12-07 | 1 komentar | Bagikan ke WhatsApp
  • Koleksi Llama 3.3
    • Koleksi ini mencakup konverter dan repositori asli Llama 3.3
    • Terakhir diperbarui 8 jam yang lalu
    • Total mencakup 1 item

1 komentar

 
GN⁺ 2024-12-07
Opini Hacker News
  • Dibandingkan dengan Llama 3.2 405B, performanya tampak serupa atau sedikit lebih baik

    • Menurut Zuck, ini adalah rilis terakhir dari seri Llama 3, dan Llama 4 dijadwalkan rilis pada 2025
    • Ini mengingatkan pada komentar terkenal Steve Jobs tentang Dropbox: 'itu fitur, bukan produk'
    • Meta mengomoditisasi AI dengan menyediakan model kuat secara open source, dan melalui ini dapat memperkuat layanan Facebook dan Instagram
    • Bukan menjual AI, melainkan menggunakan AI untuk memperkuat bisnis inti
    • Dengan merilisnya sebagai open source, mereka bisa memperoleh manfaat dari adopsi luas dan pengembangan oleh banyak pihak
  • Dalam benchmark kami, hasilnya lebih baik dari perkiraan

    • Kami akan meninjaunya lebih dalam, tetapi ini mengesankan
  • Sedang ada diskusi berkelanjutan tentang klien desktop Mac "umum" yang bagus saat ini

    • Ingin menggunakan Ollama, ChatGPT, Claude, Perplexity, dan lainnya
    • Ingin memakai chat AI di berbagai aplikasi, dan tidak harus berupa aplikasi desktop
    • MacMind keren, tetapi mahal jika dijadikan frontend untuk API lain
    • Jawaban "jangan pelit" juga masuk akal
  • Menunjukkan performa yang mirip dengan GPT-4o di berbagai benchmark

  • Mengunggah 4bit bitsandbytes, GGUF, dan bobot asli 16bit ke Hugging Face

    • Llama 3.3 70B bisa di-fine-tune 2x lebih cepat dengan VRAM di bawah 48GB, sambil mengurangi penggunaan memori hingga 70%
  • Sedang melacak harga 1M token di OpenRouter, dan harganya terus turun setiap kali halaman dimuat ulang

  • Open-sourcing Llama adalah contoh yang sangat baik dari strategi "Commoditize Your Complement"

    • Bagi yang belum pernah mendengar strategi ini, dibagikan tautan ke Gwern: "Laws of Tech: Commoditize Your Complement"
  • Pertanyaan tentang model Hugging Face

    • Apakah bisa dijalankan lewat JupyterLab di laptop
    • Apa keuntungannya
    • Apakah bisa diperbarui secara berkala
    • Apakah bisa di-fine-tune untuk kebutuhan tertentu
    • Berapa banyak waktu dan usaha yang dibutuhkan untuk melakukan fine-tuning model
    • Permintaan URL apakah Hugging Face menyediakan jawaban untuk pertanyaan-pertanyaan ini
  • Meta terus melampaui ekspektasi dengan merilis model terbuka yang kuat untuk menargetkan OpenAI/Anthropic

    • Penerima manfaat terbesar adalah para developer