11 poin oleh GN⁺ 4 jam lalu | Belum ada komentar. | Bagikan ke WhatsApp
  • Kumpulan pengalaman praktis yang merangkum seluruh proses mencari posisi Research Scientist setelah meraih gelar PhD di bidang Machine Learning
  • Berdasarkan kasus mendapat offer dari semua perusahaan tempat wawancara diselesaikan, termasuk DeepMind, Isomorphic Labs, Cohere, Meta, dan startup stealth
  • Ringkasan langkah demi langkah mulai dari cara mendapatkan wawancara, persiapan teknis, emosional, dan logistik, perbandingan startup vs big tech, hingga negosiasi gaji
  • Mencakup poin persiapan yang konkret seperti perbedaan pajak dan struktur RSU vs stock option, serta implementasi transformer dan attention secara langsung
  • Menekankan pesan bahwa wawancara pada dasarnya stokastik (stochastic), dan hasilnya tidak menentukan nilai seseorang sebagai peneliti

Hasil wawancara keseluruhan dan latar belakang

  • Penulis mengalami langsung proses mencari kerja sebagai Research Scientist setelah PhD ML dan merangkumnya, karena hampir tidak ada materi rujukan saat baru mulai
  • Mendapat offer dari semua perusahaan tempat wawancara diselesaikan — termasuk DeepMind (diterima), Isomorphic Labs, Cohere, Meta, dan startup stealth
    • Anthropic, Mistral, dan TeslaAI terlambat menghubungi sehingga proses tidak selesai
    • ReflectionAI menjadi satu-satunya penolakan untuk posisi RS, tetapi menawarkan peralihan ke jalur Engineering
  • SpaceXAI, Waymo, dan Wayve tidak mengundang wawancara
    • Ke Waymo, penulis melamar setiap 6 bulan sepanjang masa PhD tetapi tidak pernah mendapat respons

Cara mendapatkan wawancara

  • Pengungkit utama untuk mendapatkan wawancara adalah lebih banyak paper, topik yang sedang tren, dan internship yang lebih baik
    • Selama PhD, penulis memiliki 4 paper first author (atau co-first author) yang dipublikasikan di ICLR / NeurIPS / ICML (LLM, RL, Meta-Learning, Evolution Strategies)
    • Juga memiliki pengalaman internship di Apple dan pengalaman sebagai software engineer di Meta
  • Patokan kasarnya: jika punya 3+ paper first author + minimal 1 internship atau pengalaman industri, biasanya bisa konsisten mendapat callback dari lab papan atas
  • Jika sudah mulai mendapat wawancara, paper tambahan tidak banyak membantu → perlu fokus pada persiapan wawancara, bukan riset, dan karena rasa "sudah siap" tidak akan pernah benar-benar datang, sebaiknya mulai sekarang

Cover letter, referral, cold email, LinkedIn/X

  • LinkedIn / X: banyak perusahaan memposting lowongan di sana, dan untuk internship kadang itu satu-satunya jalur melamar
    • Google form yang terhubung dari lowongan harus diisi agar benar-benar dihitung sebagai lamaran resmi
  • Referral: bagus jika ada, tapi tidak wajib
    • Di DeepMind, penulis tetap mendapat undangan wawancara baik untuk posisi dengan referral maupun tanpa referral
  • Cold email: mengirim email langsung ke recruiter atau anggota tim sering kali diterima dengan baik
    • Jangan sekadar mengulang isi CV; jelaskan mengapa cocok dengan tim tersebut dan bagian mana yang menarik minat
  • Cover letter: jarang diminta, tetapi kalau diminta harus ditulis dengan benar
    • Jangan serahkan seluruh penulisan ke Claude / Gemini / ChatGPT, gunakan hanya untuk merapikan draft yang sudah ditulis sendiri

Startup vs big tech

  • Startup lebih sulit ditemukan, karena tidak ada tempat pencarian yang terpusat → kabar dari kolega, teman, dan mantan rekan kerja adalah jalur terbaik, dan karena itu kompetisinya juga cenderung lebih ringan
  • Proses wawancara startup sangat bervariasi, sedangkan big tech relatif lebih mudah diprediksi
    • Jika prosesnya terasa terlalu mudah, itu bisa menjadi sinyal tentang kompleksitas pekerjaan yang sebenarnya
  • Sifat pekerjaan bersifat dua arah — di startup yang tepat, riset bisa lebih menarik dan berdampak besar, tetapi juga bisa disertai tekanan lebih tinggi, lebih banyak pekerjaan infrastruktur, dan perubahan arah riset yang lebih sering
    • Saat wawancara, tanyakan siapa yang menentukan prioritas riset, jalur monetisasi, dan siapa kompetitornya
  • Peluang pertumbuhan: startup memberi peluang berkembang cepat, memperluas tanggung jawab, dan membentuk arah kerja, sedangkan di big tech Anda lebih menjadi salah satu dari banyak orang
  • Daya kenal CV: OpenAI atau Anthropic langsung dikenali, tetapi startup stealth yang tidak dikenal perlu penjelasan
  • Stabilitas kerja: big tech pun sudah berkali-kali melakukan PHK besar, jadi tidak ada pihak yang 100% aman

Kompensasi: RSU vs Stock Option (berdasarkan Inggris)

  • RSU (umum di big tech): menerima saham aktual sesuai jadwal vesting, dan saat vesting biasanya sekitar setengahnya langsung dijual untuk menutup pajak penghasilan — RSU dikenai pajak sebagai penghasilan
  • Stock option (umum di startup): yang diperoleh bukan saham, melainkan hak membeli saham pada harga tetap X
    • Jika harga pasar Y > X, Anda bisa membeli di X lalu menjual di Y untuk mengambil selisih; jika Y < X, opsi tersebut tidak bernilai
  • Stock option biasanya kedaluwarsa 90 hari setelah resign, dan jika perusahaan belum go public maka saham yang dibeli pun belum tentu bisa dijual
    • Di Inggris, pada saat exercise, pajak penghasilan dikenakan atas selisih Y−X meski Anda belum menerima uang sepeser pun
    • Jika keluar setelah 2 tahun di perusahaan privat lalu melakukan exercise, maka sebelum ada keuntungan nyata Anda harus menanggung biaya beli sebesar (X × jumlah opsi) + pajak penghasilan sebesar (Y−X) × jumlah opsi × tarif pajak
  • Kebanyakan perusahaan menyediakan opsi cashless exercise, dan banyak yang menjalankan buyback saham internal (liquidity event)
    • Namun pada setiap funding round kepemilikan akan terdilusi, keuntungan tambahan dikenai sekitar 20% capital gains tax, dan nilai pada liquidity event biasanya ditetapkan lebih rendah daripada valuasi resmi perusahaan
  • Ringkasnya: jika recruiter menyebut angka total kompensasi startup yang memasukkan ekuitas, tersenyumlah dengan sopan lalu diskon besar-besaran dalam perhitungan Anda

Struktur wawancara

  • Kebanyakan perusahaan mengikuti struktur yang mirip, meskipun bobot tiap tahap berbeda
  • Recruiter screen: biasanya percakapan yang tidak terlalu berat, sekaligus kesempatan menunjukkan kecocokan skill dengan posisi dan kemampuan menjelaskan paper sendiri
  • Technical interviews: bagian terbesar dari proses dan yang paling penting dipersiapkan, biasanya 3–8 sesi tergantung perusahaan
    • Coding: gaya LeetCode, umumnya Medium atau Hard
    • ML coding/debugging: implementasi attention, menulis backward pass, menemukan bug dalam training loop
    • ML knowledge: dasar, teori, applied ML, dan system design
  • Behavioural interviews: terbagi antara pertanyaan perilaku klasik dan pertanyaan bernuansa riset (topik yang diminati, prospek bidang), lebih kasual daripada technical interview tetapi jangan diremehkan

Persiapan teknis

  • Ini bagian paling penting, jangan dilewatkan — ada kasus peneliti hebat yang gagal hanya karena kurang persiapan; bekerja dengan ML setiap hari berbeda dengan mengimplementasikan attention dari nol, jadi perlu menjadwalkan belajar rutin minimal satu bulan
  • Strategi meta: minimalkan persiapan umum dan fokuskan persiapan pada wawancara dan perusahaan berikutnya secara spesifik, supaya materi tetap segar di kepala
  • Wawancara RS / Engineer bisa menanyakan hampir apa saja, mulai dari dasar seperti overfitting, LeetCode, implementasi transformer, hingga arsitektur modern seperti Griffin, TransformerXL, dan S4

Flashcards

  • Berguna untuk dasar ML, applied ML, dan diskusi riset; penulis merasa flashcard fisik lebih efektif daripada Anki
  • Menulis kartu sendiri adalah setengah dari proses belajar, jangan unduh deck buatan orang lain
  • Saat review, tanyakan balik ke diri sendiri untuk memastikan pemahaman mendalam; banyak pertanyaan yang muncul saat belajar ternyata benar-benar keluar di wawancara

Mock interview dengan LLM (Claude / Gemini)

  • Sebelum tiap wawancara, penulis menempelkan deskripsi posisi, wawancara, dan perusahaan ke LLM (terutama Claude) lalu memintanya melakukan wawancara; pertanyaan latihan dan pertanyaan asli sering tumpang tindih
  • Jika tingkat kesulitannya tidak pas, mulai chat baru dan jelaskan level serta latar belakang Anda dengan lebih spesifik
  • Untuk belajar, Claude dinilai paling baik dan feedback-nya paling adil, sedangkan Gemini cenderung terlalu banyak memuji

LeetCode / NeetCode

  • Kerjakan minimal Blind 75, opsional lanjut ke NeetCode 150, dengan fokus pada Medium
    • Targetkan solusi optimal untuk tiap soal (solusi TwoSum dengan O(N²) tidak dianggap cukup), dan jangan terlalu banyak menghabiskan waktu di Hard
  • Latih implementasi cepat untuk pola dasar seperti DFS, BFS, Graphs, Backtracking, DP, Binary Search, dan sebagainya; targetkan kurang dari 20 menit per Medium
    • Jika buntu lebih dari 15 menit, lihat solusi, tandai, lalu lanjut
  • Lebar cakupan lebih penting daripada kedalaman, total sekitar 150 soal Medium

Books

  • Designing Machine Learning Systems (Chip Huyen): mencakup banyak pertanyaan dasar dan applied ML
  • The JAX Scaling Book: ditemukan setelah wawancara selesai tetapi sangat bagus; seandainya tahu lebih awal, ini akan dipakai secara intensif
  • Reinforcement Learning (Sutton & Barto): direkomendasikan hanya untuk pemula RL; jika sudah bekerja di bidang ini, terasa berlebihan

Courses

  • Aljabar linear: kuliah YouTube Gilbert Strang, bisa ditamatkan dalam sehari pada kecepatan 2x
  • Diffusion / Flow Matching: kuliah MIT dan Stanford sama-sama bagus tetapi cukup berat di matematika; jika belum meneliti bidang ini, hafalkan intuisi dasar dan poin inti seperti diffusion SDE dan flow matching ODE

ML coding dan debugging

  • Ini area dengan materi bagus paling sedikit dan pengalaman nyata paling penting; wawancara debugging sulit dilatih karena LLM belum mampu secara stabil menghasilkan kode bug yang masuk akal
    • Meninjau codebase sendiri atau milik rekan adalah cara terbaik, dan DeepML serta Tensor Puzzles juga membantu
  • Baseline target
    • mengimplementasikan transformer end-to-end
    • mengimplementasikan causal, cross, dan self attention
    • mengimplementasikan flash attention
    • mengimplementasikan backward pass untuk attention
    • mengimplementasikan forward / backward pass MLP
    • mengimplementasikan training loop SGD dengan PyTorch atau JAX
  • Jika Anda bisa mengimplementasikan semua ini sendiri di bawah tekanan waktu, kondisinya sudah cukup baik

Persiapan emosional

  • Jika secara emosional Anda baik-baik saja, lewati bagian ini agar tidak menanam kecemasan yang tidak perlu
  • Masalah terbesar adalah tidur — penulis tidak bisa tidur pada malam sebelum wawancara, dan ketika ada 10 wawancara per minggu ini menjadi masalah serius; makan pun sulit hingga memicu mual
    • Disarankan olahraga teratur, rutinitas malam yang konsisten, dan menghindari isolasi sosial
    • Berlari sebelum wawancara membantu melepaskan energi tegang dan me-reset pikiran
  • Menjaga rutinitas pra-wawancara memberi rasa stabil yang besar — menaruh bunga segar di latar, memakai makeup atau skincare, menonton video penghibur yang sama
  • Pada titik tertentu, kecemasan lebih menghambat daripada kurangnya persiapan, dan saat wawancara pikiran bisa benar-benar kosong
    • Akan lebih baik jika sejak sebelum mulai sudah merefleksikan pemicu pribadi, hubungan dengan kegagalan, dan dasar harga diri
  • Pesan kuncinya: nilai Anda sebagai manusia tidak ditentukan oleh wawancara ini, prosesnya pada dasarnya stokastik, bahkan hal yang sebenarnya Anda kuasai pun bisa saja salah, dan itu tidak apa-apa
  • Buku yang membantu: The Now Habit, The Gifts of Imperfection, Mindset, The Tyranny of Merit

Persiapan logistik

  • Hanya satu wawancara per hari: wawancara itu menguras tenaga, jadi pada sesi ketiga dalam sehari performa akan turun secara alami; setelah wawancara pagi, gunakan sisa hari untuk persiapan berikutnya
  • Mulai dari perusahaan yang kurang diminati: misalnya startup kecil atau lokasi yang tidak diinginkan, untuk mengkalibrasi rasa proses, kepercayaan diri, dan level kompensasi lebih dulu
  • Pertimbangkan timing: tiap perusahaan bergerak dengan kecepatan berbeda, jadi usahakan agar offer datang pada waktu yang mirip untuk mendapatkan leverage nyata
  • Beri tahu semua perusahaan bahwa Anda sedang menjalani proses lain: timeline jadi lebih jelas, proses bisa dipercepat, dan Anda dipandang sebagai kandidat yang lebih serius

Negosiasi

  • Berbeda dari saran umum yang menyuruh menyembunyikan offer pesaing, beberapa perusahaan secara eksplisit meminta bukti offer lain sebelum menaikkan angka, dan satu perusahaan bahkan menanyakan keaslian screenshot
  • Perusahaan bisa menggerakkan angka cukup besar untuk kandidat yang benar-benar diinginkan, jadi selalu layak untuk bertanya; kebanyakan terbuka pada negosiasi
  • Batas waktu bervariasi dari 1–2 minggu hingga istilah samar seperti "periode yang wajar", dan biasanya tidak terlalu fleksibel untuk perpanjangan
  • Recruiter sangat peka membaca preferensi kandidat, dan sinyal kecil seperti seberapa sering menyebut nama perusahaan atau gaya bicara bisa tercatat
  • Perusahaan memiliki data historis tentang pilihan kandidat → hanya offer dari pesaing setara (seperti OpenAI) yang punya bobot nyata, sedangkan perbandingan yang tidak realistis tidak akan mempan

Proses pengambilan keputusan

  • Pada awalnya, karena cemas, ada godaan untuk menerima offer yang datang lebih cepat, tetapi dengan mempercayai intuisi penulis akhirnya menemukan pilihan yang lebih baik
  • Kriteria memilih offer berbeda untuk tiap orang — lokasi, kompensasi, reputasi, jenis pekerjaan, dan sebagainya — dan urutan preferensi bisa berubah seiring makin mengenal tim, budaya, dan kompensasi
  • Penulis berbicara dengan hampir semua orang di kedua perusahaan, tetapi karena masing-masing tentu memilih perusahaannya sendiri, itu tidak terlalu membantu → pada akhirnya, yang paling berguna adalah berdiskusi dengan orang yang benar-benar mengenal diri Anda

Jika mengulang lagi, apa yang akan diubah

  • Memelihara spreadsheet: mengelola semuanya di kepala ada batasnya; kalau sejak awal merapikan daftar perusahaan, tahap proses, deadline, dan kontak, penulis mungkin tidak akan melewatkan lamaran ke tempat yang diminati
  • Mempersiapkan emosi selain teknis: wawancara terasa seperti vonis akhir atas kemampuan sebagai peneliti dan nilai PhD, padahal itu framing yang tidak rasional; refleksi atau konseling sejak awal mungkin akan membantu
  • Lebih proaktif terhadap perusahaan yang tidak merespons: jangan hanya bergantung pada formulir lamaran; tunjukkan minat lewat cold email agar masuk radar

Daftar topik teknis

  • Ini adalah daftar topik belajar yang disusun sebelum wawancara dimulai; karena latar belakang penulis, pertanyaan tentang LLM dan RL paling sering muncul, dan hampir semua topik yang dipelajari keluar setidaknya sekali
  • Reinforcement Learning: Q-Learning / TD Learning, Bellman Equations, PPO, GRPO, GAE, DPO, Policy Gradient Theorem, On/Off-Policy, MuZero, Dreamer, AlphaGo, Soft Actor-Critic, MDP, dll.
  • LLMs: Flash Attention, LoRA, TransformerXL, Griffin, Perceiver, Scaling Laws, Mixture of Experts, RoPE, S4, Tokenisation, RLHF, Causal/Cross Attention, dll.
  • Generative Modelling: GANs, VAE dan ELBO, Score Function, Diffusion Forward/Reverse Process (DDIM/DDPM), Diffusion SDE, Flow Matching ODE, Classifier Free Guidance
  • Applied ML: Tensor Parallelism, FSDP, DDP, Pipeline Parallelism, Mixed precision training, Gradient checkpointing/accumulation/clipping, JAX, PyTorch, TensorFlow, dll.
  • General ML: Curse of dimensionality, CNN, RNN/LSTM, MLE vs MAP, Bias-Variance Tradeoff, Backprop, BatchNorm/LayerNorm/RMSNorm, Adam/AdamW, KL Divergence, Precision/Recall/F1/AUC-ROC, dll.
  • Aljabar linear: Positive Semi-Definite, Jacobian, Eigenvectors/Eigenvalues, Hessian, Null/Image space, Rank/Span, Determinant, dll.

Belum ada komentar.

Belum ada komentar.