64 poin oleh GN⁺ 2026-04-13 | 1 komentar | Bagikan ke WhatsApp
  • Strategi bootstrap untuk menjalankan beberapa perusahaan SaaS dengan MRR lebih dari $10K dengan biaya infrastruktur di bawah $20 per bulan memanfaatkan satu VPS, bahasa Go, SQLite, dan GPU lokal
  • Alih-alih AWS atau orkestrasi cloud yang rumit, semua layanan dijalankan di satu VPS seharga $5–10 sehingga fokus bisa diarahkan ke pemrosesan permintaan, bukan pengelolaan infrastruktur
  • Memilih Go sebagai bahasa backend untuk mendapatkan proses deployment yang sangat sederhana: kompilasi menjadi satu binary tunggal tanpa manajemen dependensi lalu deploy ke server
  • Menjalankan VLLM di GPU lokal (RTX 3090) untuk menurunkan biaya pemrosesan batch AI menjadi nol, dan hanya memakai model frontier lewat OpenRouter untuk fitur yang berhadapan langsung dengan pengguna
  • Bahkan tanpa venture capital, jika biaya dapat ditekan nyaris nol maka bisa memperoleh runway yang praktis tak terbatas dan punya cukup waktu untuk menemukan product-market fit

Strategi Operasi Server Lean

  • Cara umum meluncurkan web app pada 2026 adalah dengan memprovisikan klaster EKS, instance RDS, dan NAT Gateway di AWS, yang bisa membuat pengeluaran melebihi $300 per bulan bahkan tanpa satu pun pengguna
  • Sebagai alternatif, sewa VPS seharga $5–10 per bulan di Linode atau DigitalOcean dan jalankan semuanya di satu server
  • Bahkan RAM 1GB pun cukup jika dimanfaatkan dengan baik, dan jika butuh ruang ekstra bisa memakai swapfile
  • Jika server hanya satu, lokasi log, penyebab crash, dan cara restart bisa diketahui dengan tepat
  • Alasan memilih VPS daripada AWS adalah untuk menjaga biaya yang dapat diprediksi dan arsitektur yang sederhana

Mengapa Memilih Bahasa Go

  • Python atau Ruby bisa menghabiskan setengah RAM hanya untuk menyalakan interpreter dan mengelola worker gunicorn
  • Go memberikan performa yang jauh lebih baik untuk pekerjaan web, punya sistem tipe yang ketat, dan pada 2026 merupakan bahasa yang sangat mudah dipahami oleh LLM saat melakukan reasoning
  • Kelebihan utama Go adalah kesederhanaan proses deployment: seluruh aplikasi dikompilasi menjadi satu binary static-linked, dibuild di laptop lalu dikirim ke server dengan scp untuk dijalankan
  • Tidak perlu pip install, neraka dependensi, atau virtual environment, dan tanpa framework yang bengkak pun tetap bisa membangun web server tingkat production
  • Hanya dengan standard library bawaan Go, kita bisa menulis server yang menangani puluhan ribu request per detik
Iklan

Memanfaatkan AI Lokal: Menjadikan Biaya Pekerjaan Batch Nol

  • Jika ada kartu grafis di rumah, itu setara dengan sudah memiliki kredit AI tanpa batas
  • Saat membangun eh-trade.ca, diperlukan riset saham kualitatif berskala besar dengan menganalisis laporan kuartalan ribuan perusahaan, dan bila memakai OpenAI API biayanya bisa mencapai ratusan dolar
  • Sebagai gantinya, VLLM dijalankan pada RTX 3090 (24GB VRAM) yang dibeli seharga $900 di Facebook Marketplace, sehingga tidak perlu membayar penyedia AI
  • Jalur upgrade AI lokal:
    • Mulai dengan Ollama: setup dengan perintah satu baris (ollama run qwen3:32b), langsung menguji berbagai model, dan sangat cocok untuk iterasi prompt
    • Beralih ke VLLM untuk production: Ollama menjadi bottleneck saat ada request bersamaan, sedangkan VLLM jauh lebih cepat dengan PagedAttention. Jika 8–16 request async dikirim sekaligus, semuanya diproses batch di memori GPU dengan waktu yang hampir sama seperti memproses satu request
    • Transformer Lab: jika perlu pretraining model atau fine-tuning, itu bisa dilakukan dengan mudah di hardware lokal
  • Untuk mengelola ini, dikembangkan sendiri laconic: alat riset agen yang dioptimalkan untuk context window 8K, yang seperti virtual memory manager pada OS, melakukan "page out" bagian percakapan yang tidak diperlukan agar hanya fakta inti yang tetap berada di konteks LLM aktif
  • llmhub: alat yang mengabstraksikan semua LLM sebagai kombinasi provider/endpoint/apikey sehingga input-output teks dan gambar dapat ditangani mulus baik secara lokal maupun di cloud

Akses ke Model Frontier melalui OpenRouter

  • Tidak semua pekerjaan bisa diproses secara lokal, dan untuk interaksi chat berlatensi rendah yang berhadapan langsung dengan pengguna, dibutuhkan model reasoning tercanggih seperti Claude 3.5 Sonnet atau GPT-4o
  • Daripada mengelola akun billing, API key, dan rate limit terpisah untuk Anthropic, Google, dan OpenAI, semuanya disatukan lewat OpenRouter
  • Cukup tulis satu kode integrasi yang kompatibel dengan OpenAI, maka semua model frontier utama bisa langsung diakses
  • Mendukung fallback routing yang mulus: jika API Anthropic bermasalah, sistem otomatis berpindah ke model OpenAI yang setara sehingga pengguna sama sekali tidak melihat layar error dan tidak perlu logika retry yang rumit

Coding AI yang Hemat Biaya dengan GitHub Copilot

  • Di tengah peluncuran model mahal baru tiap minggu, banyak developer menghabiskan ratusan dolar per bulan untuk langganan Cursor dan API key Anthropic
  • Sebaliknya, bahkan jika memakai Claude Opus 4.6 sepanjang hari, biaya bulanan nyaris tidak pernah melebihi $60
  • Rahasianya adalah memanfaatkan model harga Microsoft: membeli langganan GitHub Copilot pada 2023 dan menghubungkannya ke VS Code standar
  • Trik utama Copilot: Microsoft menagih per request, bukan per token, dan “request” berarti satu input ke kotak chat. Bahkan jika agen menganalisis seluruh codebase selama 30 menit dan mengubah ratusan file, biayanya hanya sekitar $0.04
  • Strategi terbaik: tulis prompt yang detail dengan kriteria sukses yang ketat, lalu instruksikan "teruskan sampai semua error diperbaiki", lalu jalankan
Iklan

Menggunakan SQLite untuk Semua Database

  • Saat memulai venture baru, selalu menggunakan sqlite3 sebagai database utama
  • Dari sudut pandang enterprise, database server dalam proses terpisah sering dianggap perlu, tetapi pada praktiknya file SQLite lokal yang diakses lewat antarmuka C atau memori berkali-kali lipat lebih cepat daripada server Postgres jarak jauh yang harus melewati hop jaringan TCP
  • Ada salah kaprah soal masalah concurrency: anggapan bahwa SQLite mengunci seluruh database untuk setiap penulisan itu tidak benar, dan bisa diatasi dengan mengaktifkan Write-Ahead Logging (WAL)
    • Dengan pengaturan PRAGMA journal_mode=WAL; dan PRAGMA synchronous=NORMAL;, operasi baca dan tulis tidak saling memblokir
    • Dengan satu file .db di drive NVMe, sistem bisa menangani ribuan pengguna simultan
  • Untuk memudahkan implementasi autentikasi pengguna, dikembangkan library sendiri smhanov/auth: terintegrasi langsung dengan database yang sedang dipakai dan mendukung pendaftaran, sesi, reset kata sandi, serta login Google/Facebook/X/SAML

Kesimpulan: Membangun Startup tanpa Infrastruktur Rumit

  • Industri teknologi sering mengklaim bahwa untuk membangun bisnis nyata dibutuhkan orkestrasi yang rumit, tagihan AWS bulanan yang besar, dan venture capital jutaan dolar, tetapi itu tidak benar
  • Dengan menggabungkan satu VPS, binary hasil kompilasi statis, pekerjaan batch AI lewat hardware GPU lokal, dan kecepatan mentah SQLite, kita bisa melakukan bootstrap startup yang skalabel hanya dengan biaya setara beberapa cangkir kopi per bulan
  • Ini memberi proyek runway yang nyaris tak terbatas, sehingga ada waktu untuk fokus menyelesaikan masalah pengguna alih-alih mencemaskan burn rate

1 komentar

 
GN⁺ 2026-04-13
Komentar Hacker News
  • Di lingkungan perusahaan, ada anggapan kuat bahwa harus memakai server DB eksternal, tetapi dalam praktiknya file SQLite lokal jauh lebih cepat daripada Postgres jarak jauh saat berkomunikasi lewat antarmuka C atau memori
    Tentu saja SQLite sangat bagus, tetapi jika terhubung ke Postgres di localhost lewat Unix domain socket, overhead jaringan hampir hilang
    Ini tidak sulit digunakan dibanding SQLite, bisa memanfaatkan semua fitur Postgres, dan jauh lebih mudah untuk menjalankan report, menyiapkan read replica, maupun membangun HA
    Menjalankan Postgres di server yang sama dengan aplikasi adalah pilihan yang sama sekali berbeda levelnya dari overengineering seperti membangun klaster Kubernetes

    • Bahkan di mesin yang sama, SQLite jauh lebih cepat daripada Postgres yang memakai domain socket (contoh 100.000 TPS)
      Saat menjalankan monolithic app di satu mesin, tidak banyak fitur yang diberikan Postgres dibanding SQLite
      SQLite bisa diperluas langsung dengan bahasa aplikasi lewat Application functions, dan berkat Litestream, backup dan replikasi juga jauh lebih baik
      Namun setelan bawaannya kurang bagus, jadi koneksi baca/tulis perlu dipisahkan dan aplikasi harus mengelola write queue sendiri
    • Jika benar-benar menjalankan 100.000 kueri SELECT 1, hasilnya berbeda jauh: Postgres 2,77 detik, SQLite (in-memory) 0,07 detik (tautan benchmark)
    • Saya pernah memakai SQLite dengan ekstensi dalam skenario performa tinggi yang memproses jutaan dokumen per detik
      Ini memang bisa dilakukan dengan server jarak jauh, tetapi akan jauh lebih rumit
      Sebagai gantinya, DB diunggah ke S3 agar tiap instance menerima salinannya dan memprosesnya secara paralel. SQLite adalah alternatif yang terbukti saat yang dibutuhkan adalah performa, bukan sekadar fitur
    • Bukankah ucapan “bisa memakai semua fitur Postgres” justru pendekatan YAGNI (You Ain’t Gonna Need It) yang dikritik TFA?
    • Semakin banyak fitur yang tidak diperlukan, justru semakin menjadi kerugian bersih. DB yang ideal adalah yang hanya menyediakan fitur yang dibutuhkan
  • Banyak orang percaya bahwa sejak awal harus memakai konfigurasi rumit seperti serverless, Kubernetes, multi-zone HA
    Jika kita bilang “cukup jalankan saja di VPS murah,” responsnya biasanya “bagaimana dengan scaling?”, “backup?”, “maintenance?”—padahal itu pada dasarnya hanya mengulang slogan pemasaran cloud
    Sikap seperti ini mendekati learned helplessness

    • Saat bekerja sebagai konsultan, saya sering merancang 25 komponen cloud untuk aplikasi dengan pengguna bahkan belum sampai 200 orang. Semua ini hasil dari pelatihan bahwa ‘cloud = harus rumit’
    • Orang yang menangani pembelian IT rela menghamburkan uang perusahaan agar mereka tidak perlu memahami sistemnya
    • Sekarang saya melihat fenomena yang sama pada workflow berbasis agent. Data pelatihannya penuh dengan codebase untuk tim besar, sehingga proyek kecil pun diarahkan ke struktur raksasa
      Misalnya, SPA sederhana yang hanya berisi beberapa form input malah diberi Shadcn, Tailwind, React, Zod, dan Vite sekaligus. Beban maintenance-nya luar biasa
      Konfigurasi seperti ini mungkin bisa jadi “jawaban yang benar”, tetapi bukan jawaban yang cocok untuk konteksnya
    • “Generasi cloud-native” tidak pernah punya kesempatan belajar apa yang sebenarnya dibutuhkan aplikasi dasar, karena terbiasa dengan paket gratis
    • Meski begitu, saya tetap menganggap backup itu penting
  • Saya memakai Linode atau DigitalOcean dan hanya membayar 5~10 dolar per bulan. RAM 1GB sudah cukup
    Kalau beberapa proyek digabung dalam satu server dedicated, biayanya bisa lebih ditekan lagi
    Misalnya saya memakai server 40 euro per bulan dari lelang server Hetzner, lalu memasang Proxmox untuk menjalankan beberapa VM (tautan Proxmox)
    Bahkan jika membuat 15 VM, biayanya hanya sekitar 2,66 euro per VM, jadi efisiensi biaya dibanding skala sangat tinggi
    Kalau memakai perangkat refurbish, backup wajib dilakukan, tetapi itu memang sesuatu yang tetap harus dikerjakan
    Tempat seperti Hetzner, Contabo, dan Scaleway masih menjadi opsi murah

    • Harga Hetzner memang naik, tetapi OVH menawarkan hardware yang lebih baru di kisaran harga serupa
    • Saya penasaran kenapa memakai VM dan bukan container
    • Saya juga penasaran bagaimana menangani IPv4. Saya ragu apakah menyewa VM besar sebagai hypervisor diizinkan secara komersial
    • Rasanya bukankah menjalankannya langsung sebagai container Docker lebih efisien?
  • Menurut saya, faktor penghematan biaya terbesar dari SQLite adalah mode WAL
    Python atau Node juga bisa dipakai sama baiknya seperti Go. VPS Hetzner dengan RAM 4GB dan jaringan 10TB harganya sekitar 5 dolar per bulan
    Namun, jika memakai server dedicated, Anda harus sering membackup DB dan juga bertanggung jawab sendiri atas keamanan
    Saya menyiapkannya dengan Terraform: akses SSH dibatasi hanya untuk IP saya, lalu memasang Tailscale dan menutup port SSH publik

    • Untuk backup, paling aman memakai storage dari perusahaan yang berbeda dengan penyedia VM. Anda harus tetap bisa memulihkan data meski akun dibekukan
      Saya memakai Backblaze B2, tetapi dengan Restic bisa dengan mudah backup ke layanan lain juga
    • Untuk keamanan SSH, belum tentu perlu konfigurasi yang rumit. Password yang kuat saja bisa cukup
    • Dulu saya pernah membiarkan Postgres terbuka dengan password bawaan dan dalam sehari server itu dibajak menjadi bot server
      Baru-baru ini pun log percobaan SSH menumpuk hanya dalam 1 jam. Sekarang saya menonaktifkan login password dan hanya mengakses lewat Tailscale
      Server yang terekspos ke internet benar-benar berbahaya
    • Sulit dipercaya server bisa terinfeksi lewat SSH hanya dalam satu jam. Kecuali password-nya lemah atau VNC dibiarkan terbuka, rasanya mustahil
    • Saya juga membuang Postgres dan beralih ke SQLite WAL saat memindahkan situs Django saya ke Docker Compose. Hasilnya jadi jauh lebih mudah dikelola dan dibackup
  • Saya rasa batas RAM 1GB tidak perlu. Dengan 20 dolar per bulan, Anda bisa mendapat RAM 8GB dan memakainya untuk cache atau DB
    Selisih 15 dolar tidak berdampak besar pada operasional bisnis. Pola pikir yang memaksa semuanya masuk VPS 5 dolar tidak membantu pertumbuhan bisnis

    • Tapi 15 dolar juga bukan uang kecil. Kalau 1GB sudah cukup, tidak ada alasan untuk mengeluarkan lebih banyak
      Dulu LAMP stack juga berjalan baik dengan 128MB, dan situs web sekarang pun tidak serumit itu
    • Latensi baca NVMe ada di kisaran 100µs, jadi dengan SQLite pun Anda bisa menangani ratusan request per detik
      Bahkan 17 juta request per hari tanpa cache masih bisa ditangani, jadi menaikkan infrastruktur 4x sebelum dibutuhkan hanyalah pemborosan
    • Alasan sebenarnya dari batas 1GB adalah latihan untuk menghindari overengineering dan fokus pada nilai bagi pelanggan
    • Sistem modern jauh lebih efisien dalam penggunaan RAM berkat kompresi halaman dan swap NVMe.
      Model Macbook Neo 8GB adalah contoh yang bagus untuk itu
    • Saya juga setuju selisih 15 dolar tidak besar, tetapi intinya memang ada pada meminimalkan biaya hosting
  • WebSequenceDiagram tampak seperti produk yang keren
    Namun yang lebih sulit daripada implementasi teknis adalah menemukan masalah yang benar-benar bernilai dan menjangkau pengguna. Di situlah nilai yang sebenarnya

    • Saya juga memikirkan hal yang sama. Setelah bekerja dan menghabiskan waktu bersama keluarga, rasanya waktu sehari tidak pernah cukup. Tetapi saat mengetahui masalah di domain tertentu, solusinya terlihat begitu jelas
    • Produk pesaing juga sudah banyak. Misalnya yang seperti Excalidraw
  • Saya berlangganan GitHub Copilot pada 2023, menghubungkannya ke VS Code, dan terus memakainya sejak itu
    Hal pentingnya adalah Microsoft menerapkan penagihan per request. Dengan satu request, walau seluruh kode diperbaiki selama puluhan menit, saya hanya membayar sekitar 0,04 dolar
    Jadi saya menulis prompt yang sangat spesifik, menyuruhnya “teruskan sampai semua error terselesaikan,” lalu saya pergi minum kopi. Rasanya seperti Satya Nadella mensubsidi biaya komputasi saya

    • Tetapi ada kasus akun dibekukan karena menyalahgunakan sistem per request seperti ini (kasus di Reddit)
    • Penulis menyebut GPT‑4o dan Sonnet 3.5 sebagai SOTA, jadi tip AI-nya sebaiknya dilihat dengan sedikit skeptis
    • (Komentar dihapus) mengatakan dia tidak tahu kenapa mendapat downvote
  • Saya tidak belajar hal baru dari tulisan ini. Sebagian besar terasa seperti saran dasar yang dibungkus AI
    Dari judulnya saya kira isinya akan membahas mencari ide dan melakukan peluncuran yang sukses

    • Kalau judulnya seperti “dengan kurang dari $5 per bulan,” wajar jika isinya saran dasar. Namun ternyata masih banyak orang yang belum tahu hal-hal seperti ini
    • Kalau begitu, saya sarankan memulai blog. Pengetahuan yang Anda anggap dasar bisa jadi hal baru bagi orang lain
    • Saya juga akan dengan senang hati mengeluarkan 5.000 dolar per bulan kalau bisa menghasilkan 10.000 dolar. Masalahnya adalah menemukan cara menciptakan pendapatan
    • Kalimat seperti “butuh penalaran mutakhir dari Claude 3.5 Sonnet atau GPT‑4o” adalah jejak tulisan AI
    • Namun inflasi resource yang dibicarakan penulis memang nyata. Saya sering melihat pekerjaan yang cukup diselesaikan dengan skrip Python sederhana malah dipaksakan memakai AWS dan Spark secara berlebihan
  • Bagi yang penasaran seperti saya, MRR berarti “Monthly Recurring Revenue (pendapatan berulang bulanan)”

    • Mengejutkan bahwa ada orang yang sudah bergabung 16 tahun tetapi tidak tahu MRR
    • Ada juga ARR (Annual Recurring Revenue), tetapi biasanya itu hanya angka MRR yang dikalikan 12 agar terlihat lebih besar.
      Saya bahkan pernah melihat orang baru beroperasi dua bulan lalu sudah mengumumkan ARR
  • Dalam banyak kasus, pola pikir yang berpusat pada cloud secara tidak perlu meningkatkan kompleksitas dan biaya
    Sebagian besar proyek sebenarnya sudah cukup dengan VPS kelas menengah
    Perusahaan kami dulu bisa menjalankan halaman untuk 600.000 pengguna dengan VPS 30 euro, tetapi setelah pindah ke AWS kami membayar 800 euro per bulan. Tidak ada manfaat sama sekali
    Jika tidak ada alasan khusus, lebih baik mempertahankan pendekatan server sederhana yang sudah bekerja baik selama puluhan tahun
    Sebagai referensi, saya dengar StackOverflow juga dijalankan hanya dengan beberapa root server yang kuat