Cara Menjalankan Beberapa Perusahaan dengan Pendapatan Bulanan $10K Menggunakan Stack $20 per Bulan
(stevehanov.ca)- Strategi bootstrap untuk menjalankan beberapa perusahaan SaaS dengan MRR lebih dari $10K dengan biaya infrastruktur di bawah $20 per bulan memanfaatkan satu VPS, bahasa Go, SQLite, dan GPU lokal
- Alih-alih AWS atau orkestrasi cloud yang rumit, semua layanan dijalankan di satu VPS seharga $5–10 sehingga fokus bisa diarahkan ke pemrosesan permintaan, bukan pengelolaan infrastruktur
- Memilih Go sebagai bahasa backend untuk mendapatkan proses deployment yang sangat sederhana: kompilasi menjadi satu binary tunggal tanpa manajemen dependensi lalu deploy ke server
- Menjalankan VLLM di GPU lokal (RTX 3090) untuk menurunkan biaya pemrosesan batch AI menjadi nol, dan hanya memakai model frontier lewat OpenRouter untuk fitur yang berhadapan langsung dengan pengguna
- Bahkan tanpa venture capital, jika biaya dapat ditekan nyaris nol maka bisa memperoleh runway yang praktis tak terbatas dan punya cukup waktu untuk menemukan product-market fit
Strategi Operasi Server Lean
- Cara umum meluncurkan web app pada 2026 adalah dengan memprovisikan klaster EKS, instance RDS, dan NAT Gateway di AWS, yang bisa membuat pengeluaran melebihi $300 per bulan bahkan tanpa satu pun pengguna
- Sebagai alternatif, sewa VPS seharga $5–10 per bulan di Linode atau DigitalOcean dan jalankan semuanya di satu server
- Bahkan RAM 1GB pun cukup jika dimanfaatkan dengan baik, dan jika butuh ruang ekstra bisa memakai swapfile
- Jika server hanya satu, lokasi log, penyebab crash, dan cara restart bisa diketahui dengan tepat
- Alasan memilih VPS daripada AWS adalah untuk menjaga biaya yang dapat diprediksi dan arsitektur yang sederhana
Mengapa Memilih Bahasa Go
- Python atau Ruby bisa menghabiskan setengah RAM hanya untuk menyalakan interpreter dan mengelola worker gunicorn
- Go memberikan performa yang jauh lebih baik untuk pekerjaan web, punya sistem tipe yang ketat, dan pada 2026 merupakan bahasa yang sangat mudah dipahami oleh LLM saat melakukan reasoning
- Kelebihan utama Go adalah kesederhanaan proses deployment: seluruh aplikasi dikompilasi menjadi satu binary static-linked, dibuild di laptop lalu dikirim ke server dengan
scpuntuk dijalankan - Tidak perlu
pip install, neraka dependensi, atau virtual environment, dan tanpa framework yang bengkak pun tetap bisa membangun web server tingkat production - Hanya dengan standard library bawaan Go, kita bisa menulis server yang menangani puluhan ribu request per detik
Memanfaatkan AI Lokal: Menjadikan Biaya Pekerjaan Batch Nol
- Jika ada kartu grafis di rumah, itu setara dengan sudah memiliki kredit AI tanpa batas
- Saat membangun eh-trade.ca, diperlukan riset saham kualitatif berskala besar dengan menganalisis laporan kuartalan ribuan perusahaan, dan bila memakai OpenAI API biayanya bisa mencapai ratusan dolar
- Sebagai gantinya, VLLM dijalankan pada RTX 3090 (24GB VRAM) yang dibeli seharga $900 di Facebook Marketplace, sehingga tidak perlu membayar penyedia AI
- Jalur upgrade AI lokal:
- Mulai dengan Ollama: setup dengan perintah satu baris (
ollama run qwen3:32b), langsung menguji berbagai model, dan sangat cocok untuk iterasi prompt - Beralih ke VLLM untuk production: Ollama menjadi bottleneck saat ada request bersamaan, sedangkan VLLM jauh lebih cepat dengan PagedAttention. Jika 8–16 request async dikirim sekaligus, semuanya diproses batch di memori GPU dengan waktu yang hampir sama seperti memproses satu request
- Transformer Lab: jika perlu pretraining model atau fine-tuning, itu bisa dilakukan dengan mudah di hardware lokal
- Mulai dengan Ollama: setup dengan perintah satu baris (
- Untuk mengelola ini, dikembangkan sendiri laconic: alat riset agen yang dioptimalkan untuk context window 8K, yang seperti virtual memory manager pada OS, melakukan "page out" bagian percakapan yang tidak diperlukan agar hanya fakta inti yang tetap berada di konteks LLM aktif
- llmhub: alat yang mengabstraksikan semua LLM sebagai kombinasi provider/endpoint/apikey sehingga input-output teks dan gambar dapat ditangani mulus baik secara lokal maupun di cloud
Akses ke Model Frontier melalui OpenRouter
- Tidak semua pekerjaan bisa diproses secara lokal, dan untuk interaksi chat berlatensi rendah yang berhadapan langsung dengan pengguna, dibutuhkan model reasoning tercanggih seperti Claude 3.5 Sonnet atau GPT-4o
- Daripada mengelola akun billing, API key, dan rate limit terpisah untuk Anthropic, Google, dan OpenAI, semuanya disatukan lewat OpenRouter
- Cukup tulis satu kode integrasi yang kompatibel dengan OpenAI, maka semua model frontier utama bisa langsung diakses
- Mendukung fallback routing yang mulus: jika API Anthropic bermasalah, sistem otomatis berpindah ke model OpenAI yang setara sehingga pengguna sama sekali tidak melihat layar error dan tidak perlu logika retry yang rumit
Coding AI yang Hemat Biaya dengan GitHub Copilot
- Di tengah peluncuran model mahal baru tiap minggu, banyak developer menghabiskan ratusan dolar per bulan untuk langganan Cursor dan API key Anthropic
- Sebaliknya, bahkan jika memakai Claude Opus 4.6 sepanjang hari, biaya bulanan nyaris tidak pernah melebihi $60
- Rahasianya adalah memanfaatkan model harga Microsoft: membeli langganan GitHub Copilot pada 2023 dan menghubungkannya ke VS Code standar
- Trik utama Copilot: Microsoft menagih per request, bukan per token, dan “request” berarti satu input ke kotak chat. Bahkan jika agen menganalisis seluruh codebase selama 30 menit dan mengubah ratusan file, biayanya hanya sekitar $0.04
- Strategi terbaik: tulis prompt yang detail dengan kriteria sukses yang ketat, lalu instruksikan "teruskan sampai semua error diperbaiki", lalu jalankan
Menggunakan SQLite untuk Semua Database
- Saat memulai venture baru, selalu menggunakan sqlite3 sebagai database utama
- Dari sudut pandang enterprise, database server dalam proses terpisah sering dianggap perlu, tetapi pada praktiknya file SQLite lokal yang diakses lewat antarmuka C atau memori berkali-kali lipat lebih cepat daripada server Postgres jarak jauh yang harus melewati hop jaringan TCP
- Ada salah kaprah soal masalah concurrency: anggapan bahwa SQLite mengunci seluruh database untuk setiap penulisan itu tidak benar, dan bisa diatasi dengan mengaktifkan Write-Ahead Logging (WAL)
- Dengan pengaturan
PRAGMA journal_mode=WAL;danPRAGMA synchronous=NORMAL;, operasi baca dan tulis tidak saling memblokir - Dengan satu file
.dbdi drive NVMe, sistem bisa menangani ribuan pengguna simultan
- Dengan pengaturan
- Untuk memudahkan implementasi autentikasi pengguna, dikembangkan library sendiri smhanov/auth: terintegrasi langsung dengan database yang sedang dipakai dan mendukung pendaftaran, sesi, reset kata sandi, serta login Google/Facebook/X/SAML
Kesimpulan: Membangun Startup tanpa Infrastruktur Rumit
- Industri teknologi sering mengklaim bahwa untuk membangun bisnis nyata dibutuhkan orkestrasi yang rumit, tagihan AWS bulanan yang besar, dan venture capital jutaan dolar, tetapi itu tidak benar
- Dengan menggabungkan satu VPS, binary hasil kompilasi statis, pekerjaan batch AI lewat hardware GPU lokal, dan kecepatan mentah SQLite, kita bisa melakukan bootstrap startup yang skalabel hanya dengan biaya setara beberapa cangkir kopi per bulan
- Ini memberi proyek runway yang nyaris tak terbatas, sehingga ada waktu untuk fokus menyelesaikan masalah pengguna alih-alih mencemaskan burn rate
1 komentar
Komentar Hacker News
Di lingkungan perusahaan, ada anggapan kuat bahwa harus memakai server DB eksternal, tetapi dalam praktiknya file SQLite lokal jauh lebih cepat daripada Postgres jarak jauh saat berkomunikasi lewat antarmuka C atau memori
Tentu saja SQLite sangat bagus, tetapi jika terhubung ke Postgres di localhost lewat Unix domain socket, overhead jaringan hampir hilang
Ini tidak sulit digunakan dibanding SQLite, bisa memanfaatkan semua fitur Postgres, dan jauh lebih mudah untuk menjalankan report, menyiapkan read replica, maupun membangun HA
Menjalankan Postgres di server yang sama dengan aplikasi adalah pilihan yang sama sekali berbeda levelnya dari overengineering seperti membangun klaster Kubernetes
Saat menjalankan monolithic app di satu mesin, tidak banyak fitur yang diberikan Postgres dibanding SQLite
SQLite bisa diperluas langsung dengan bahasa aplikasi lewat Application functions, dan berkat Litestream, backup dan replikasi juga jauh lebih baik
Namun setelan bawaannya kurang bagus, jadi koneksi baca/tulis perlu dipisahkan dan aplikasi harus mengelola write queue sendiri
SELECT 1, hasilnya berbeda jauh: Postgres 2,77 detik, SQLite (in-memory) 0,07 detik (tautan benchmark)Ini memang bisa dilakukan dengan server jarak jauh, tetapi akan jauh lebih rumit
Sebagai gantinya, DB diunggah ke S3 agar tiap instance menerima salinannya dan memprosesnya secara paralel. SQLite adalah alternatif yang terbukti saat yang dibutuhkan adalah performa, bukan sekadar fitur
Banyak orang percaya bahwa sejak awal harus memakai konfigurasi rumit seperti serverless, Kubernetes, multi-zone HA
Jika kita bilang “cukup jalankan saja di VPS murah,” responsnya biasanya “bagaimana dengan scaling?”, “backup?”, “maintenance?”—padahal itu pada dasarnya hanya mengulang slogan pemasaran cloud
Sikap seperti ini mendekati learned helplessness
Misalnya, SPA sederhana yang hanya berisi beberapa form input malah diberi Shadcn, Tailwind, React, Zod, dan Vite sekaligus. Beban maintenance-nya luar biasa
Konfigurasi seperti ini mungkin bisa jadi “jawaban yang benar”, tetapi bukan jawaban yang cocok untuk konteksnya
Saya memakai Linode atau DigitalOcean dan hanya membayar 5~10 dolar per bulan. RAM 1GB sudah cukup
Kalau beberapa proyek digabung dalam satu server dedicated, biayanya bisa lebih ditekan lagi
Misalnya saya memakai server 40 euro per bulan dari lelang server Hetzner, lalu memasang Proxmox untuk menjalankan beberapa VM (tautan Proxmox)
Bahkan jika membuat 15 VM, biayanya hanya sekitar 2,66 euro per VM, jadi efisiensi biaya dibanding skala sangat tinggi
Kalau memakai perangkat refurbish, backup wajib dilakukan, tetapi itu memang sesuatu yang tetap harus dikerjakan
Tempat seperti Hetzner, Contabo, dan Scaleway masih menjadi opsi murah
Menurut saya, faktor penghematan biaya terbesar dari SQLite adalah mode WAL
Python atau Node juga bisa dipakai sama baiknya seperti Go. VPS Hetzner dengan RAM 4GB dan jaringan 10TB harganya sekitar 5 dolar per bulan
Namun, jika memakai server dedicated, Anda harus sering membackup DB dan juga bertanggung jawab sendiri atas keamanan
Saya menyiapkannya dengan Terraform: akses SSH dibatasi hanya untuk IP saya, lalu memasang Tailscale dan menutup port SSH publik
Saya memakai Backblaze B2, tetapi dengan Restic bisa dengan mudah backup ke layanan lain juga
Baru-baru ini pun log percobaan SSH menumpuk hanya dalam 1 jam. Sekarang saya menonaktifkan login password dan hanya mengakses lewat Tailscale
Server yang terekspos ke internet benar-benar berbahaya
Saya rasa batas RAM 1GB tidak perlu. Dengan 20 dolar per bulan, Anda bisa mendapat RAM 8GB dan memakainya untuk cache atau DB
Selisih 15 dolar tidak berdampak besar pada operasional bisnis. Pola pikir yang memaksa semuanya masuk VPS 5 dolar tidak membantu pertumbuhan bisnis
Dulu LAMP stack juga berjalan baik dengan 128MB, dan situs web sekarang pun tidak serumit itu
Bahkan 17 juta request per hari tanpa cache masih bisa ditangani, jadi menaikkan infrastruktur 4x sebelum dibutuhkan hanyalah pemborosan
Model Macbook Neo 8GB adalah contoh yang bagus untuk itu
WebSequenceDiagram tampak seperti produk yang keren
Namun yang lebih sulit daripada implementasi teknis adalah menemukan masalah yang benar-benar bernilai dan menjangkau pengguna. Di situlah nilai yang sebenarnya
Saya berlangganan GitHub Copilot pada 2023, menghubungkannya ke VS Code, dan terus memakainya sejak itu
Hal pentingnya adalah Microsoft menerapkan penagihan per request. Dengan satu request, walau seluruh kode diperbaiki selama puluhan menit, saya hanya membayar sekitar 0,04 dolar
Jadi saya menulis prompt yang sangat spesifik, menyuruhnya “teruskan sampai semua error terselesaikan,” lalu saya pergi minum kopi. Rasanya seperti Satya Nadella mensubsidi biaya komputasi saya
Saya tidak belajar hal baru dari tulisan ini. Sebagian besar terasa seperti saran dasar yang dibungkus AI
Dari judulnya saya kira isinya akan membahas mencari ide dan melakukan peluncuran yang sukses
Bagi yang penasaran seperti saya, MRR berarti “Monthly Recurring Revenue (pendapatan berulang bulanan)”
Saya bahkan pernah melihat orang baru beroperasi dua bulan lalu sudah mengumumkan ARR
Dalam banyak kasus, pola pikir yang berpusat pada cloud secara tidak perlu meningkatkan kompleksitas dan biaya
Sebagian besar proyek sebenarnya sudah cukup dengan VPS kelas menengah
Perusahaan kami dulu bisa menjalankan halaman untuk 600.000 pengguna dengan VPS 30 euro, tetapi setelah pindah ke AWS kami membayar 800 euro per bulan. Tidak ada manfaat sama sekali
Jika tidak ada alasan khusus, lebih baik mempertahankan pendekatan server sederhana yang sudah bekerja baik selama puluhan tahun
Sebagai referensi, saya dengar StackOverflow juga dijalankan hanya dengan beberapa root server yang kuat