Kenapa Kreditmu Cepat Habis
Kamu bayar Claude setiap bulan. Tapi entah kenapa kuota sudah hampir habis sebelum jam 3 sore.
Ini bukan bug. Ini ada penjelasannya — dan setelah kamu tahu, kebiasaan pakaimu akan berubah cukup signifikan.
Root cause yang kebanyakan orang tidak tahu: setiap kali kamu kirim pesan baru, Claude tidak hanya membaca pesan terbarumu. Dia membaca ulang seluruh percakapan dari awal — setiap pesan yang pernah dikirim dalam thread itu.
Pesan pertamamu murah. Pesan ke-30? Claude harus baca 29 pertukaran sebelumnya dulu, baru mulai menjawab. Semakin panjang percakapan, semakin mahal setiap pesan berikutnya.
Satu konsep yang perlu kamu pegang: token — satuan teks yang dipakai Claude untuk mengukur input dan output, kira-kira satu kata per token. Semua batas penggunaan Claude diukur dalam token. Semua tips di panduan ini punya satu tujuan yang sama: hindari buang-buang token untuk hal yang tidak perlu, supaya sisanya bisa dipakai untuk yang benar-benar penting.
23 Kebiasaan untuk Hemat Token Claude
Kategori A: Kebiasaan yang Jarang Diketahui
1. Konversi file sebelum diupload
PDF satu halaman bisa menelan 1.500–3.000 token. Screenshot penuh bisa lebih lagi. Kalau kamu upload file yang sama ke empat percakapan berbeda dalam satu minggu, kamu sudah buang ratusan ribu token hanya untuk satu dokumen.
Solusinya sederhana: ekstrak teks yang relevan dari dokumen, paste ke file .md atau .txt bersih, baru upload. Workflow praktis: buka doc.new → paste teks → download sebagai Markdown. Claude membaca teks jauh lebih efisien dari PDF yang penuh formatting.
2. Rencanakan di Chat, bangun di Cowork
Pembuatan file — spreadsheet, dokumen panjang, presentasi — mengonsumsi limit lebih banyak dari chat biasa. Kalau kamu langsung buka Cowork dan minta Claude "buat financial model lengkap" tanpa brief yang jelas, kamu akan habiskan banyak token untuk iterasi yang seharusnya bisa diselesaikan di Chat dulu.
Rencanakan dulu di Claude Chat: struktur dokumen, section yang dibutuhkan, asumsi yang perlu dimasukkan. Setelah tahu persis apa yang diinginkan, baru pindah ke Cowork untuk eksekusi. Prinsipnya: thinking di produk yang murah, building di produk yang mahal.
3. Tulis prompt pendek, minta Claude yang tanya
Prompt 500 kata mengonsumsi 500 token — dan dibaca ulang setiap kali kamu kirim pesan berikutnya. Alternatif yang jauh lebih hemat:
Aku mau buat [jenis konten]. Tanya aku satu per satu untuk
dapatkan informasi yang kamu butuhkan sebelum mulai.
Klik pilihan jawaban hampir tidak ada token-nya. Mengetik paragraf instruksi panjang sangat mahal. Biarkan Claude yang menggali konteks lewat pertanyaan terstruktur — kamu cukup jawab singkat.
4. Jawab dengan suara, bukan mengetik
Ini counterintuitive tapi efektif. Saat mengetik, orang cenderung menulis prompt yang terlalu pendek dan vague — karena mengetik itu ada "usaha"-nya. Prompt vague menghasilkan output yang meleset, kamu kirim koreksi, Claude baca semua dari awal lagi, dan siklus ini terus berputar.
Saat berbicara, kamu secara alami memberikan lebih banyak konteks dalam satu napas. Claude mendapat informasi yang cukup dari pesan pertama, tidak perlu bolak-balik klarifikasi. Gunakan fitur dictate bawaan HP atau tools seperti Whispr Flow untuk mengubah suara menjadi teks di prompt.
5. Mulai percakapan baru untuk topik baru
Percakapan yang sudah panjang membuat setiap pesan baru makin mahal. Kalau kamu ganti topik di percakapan yang sudah 40 pesan, Claude tetap membaca 40 pesan lama itu meskipun sama sekali tidak relevan untuk topik barumu.
Biasakan: topik baru = chat baru. Untuk Cowork: task baru = task baru, bukan dilanjutkan di task lama yang sudah panjang.
6. Minta output ringkas secara eksplisit
Claude default menghasilkan respons yang panjang dan elaboratif. Output panjang mahal di dua sisi: biaya untuk generate-nya, dan biaya karena dia ikut terbawa ke pesan-pesan berikutnya.
Tambahkan instruksi ini ke setiap prompt yang tidak perlu output panjang:
Jawab ringkas — maksimal 3-5 poin. Tanpa pembuka, tanpa kesimpulan.
7. Jangan upload file yang sama berulang kali
Setiap upload file = token terpakai untuk membacanya. Kalau dokumen yang sama kamu upload di lima percakapan berbeda, itu lima kali pemborosan.
Solusi: simpan dokumen penting di Project atau Cowork folder. Upload sekali, Claude bisa akses kapan saja tanpa perlu upload ulang.
8. Pakai model yang tepat untuk tugas yang tepat
- Opus: analisis kompleks, keputusan penting, tulisan berkualitas tinggi
- Sonnet: draft awal, rangkuman, formatting, pertanyaan faktual
- Haiku: tugas sangat sederhana, respons cepat, preprocessing
Kesalahan umum: pakai Opus untuk semua hal — termasuk yang tidak butuh reasoning mendalam. Memakai model yang tepat bisa mengurangi konsumsi token hingga 40–60% untuk pekerjaan sehari-hari.
Kategori B: Kebiasaan Penggunaan yang Lebih Cerdas
9. Kompres file about-me di Cowork
File tentang-saya.md yang terlalu panjang mengonsumsi ribuan token di setiap sesi Cowork — bahkan kalau sebagian besar isinya tidak relevan untuk tugas hari itu.
Target ideal: di bawah 2.000 token. Cara kompres:
Baca file tentang-saya.md ini. Identifikasi informasi yang redundan,
outdated, atau tidak lagi relevan. Buat versi yang lebih padat —
maksimal 2.000 token — yang mempertahankan semua informasi penting
tanpa mengulangi hal yang sama dengan cara berbeda.
10. Gunakan bullet point, bukan prosa panjang
Instruksi dalam bentuk bullet point lebih efisien dari paragraf panjang — Claude memproses struktur yang jelas lebih cepat dan akurat. Instruksi yang ambigu juga menyebabkan Claude perlu mengklarifikasi sebelum mulai, yang berarti satu pertukaran ekstra yang bisa dihindari.
Sebelum: "Tolong bantu aku menulis email ke klien tentang penundaan proyek dengan tone yang profesional tapi tetap hangat dan tidak terdengar seperti kamu mencari-cari alasan tapi juga tidak terlalu defensif..."
Sesudah:
Tulis email ke klien:
- Topik: penundaan proyek 2 minggu
- Tone: profesional, tidak defensif
- Sertakan: alasan singkat + langkah selanjutnya
11. Batch tugas serupa dalam satu sesi
Kalau punya lima email klien yang perlu ditulis, kerjakan dalam satu percakapan — bukan lima chat terpisah. Konteks yang sudah dibangun di percakapan itu (gaya, instruksi, contoh) jadi investasi yang dipakai untuk semua task.
Ini kebalikan dari Tip 5: topik berbeda = chat baru. Tapi tugas serupa dalam satu topik = satu chat yang efisien.
12. Mulai chat baru dari summary kalau percakapan sudah sangat panjang
Kalau satu percakapan sudah sangat panjang dan ada banyak bagian yang tidak relevan lagi, jangan terus di thread yang sama. Salin poin-poin penting, buka chat baru, mulai dengan:
Konteks singkat: [2-3 kalimat ringkasan situasi dan keputusan yang
sudah diambil]. Dari sini, aku butuh [lanjutan task].
Claude yang mulai dari clean context jauh lebih efisien dari Claude yang harus menyaring puluhan pesan lama untuk menemukan yang relevan.
13. Gunakan Extended Thinking secara selektif
Extended Thinking sangat powerful tapi mengonsumsi token secara signifikan lebih banyak dari respons biasa — karena Claude menjalankan proses reasoning internal yang panjang sebelum menjawab.
Pakai ketika: keputusan kompleks dengan banyak variabel, analisis mendalam, konten berkualitas tinggi yang butuh reasoning berlapis.
Tidak perlu ketika: formatting, rangkuman singkat, pertanyaan faktual, draft cepat yang akan banyak kamu edit sendiri.
14. Simpan prompt template sebagai file, bukan paste ulang
Kalau kamu copy-paste prompt panjang yang sama di setiap chat baru, kamu membuang token yang sama berulang kali.
Simpan prompt template sebagai file di Cowork folder atau Project Instructions. Claude membaca dari file di awal sesi — tidak perlu kamu paste ulang setiap kali. Satu kali investasi, dipakai selamanya.
Kategori C: Kebiasaan Tim
15. Standardisasi prompt di seluruh tim
Setiap anggota tim yang menulis prompt berbeda-beda untuk tugas yang sama menghasilkan dua masalah sekaligus: output yang tidak konsisten, dan token terbuang untuk output yang harus direvisi berkali-kali.
Buat satu prompt template terbaik untuk setiap deliverable berulang — email klien, laporan mingguan, brief kreatif — simpan di Project yang bisa diakses semua anggota tim. Semua pakai template yang sama.
16. Audit Project context secara berkala
Project yang sudah lama punya file konteks yang outdated atau redundan — informasi yang sudah tidak relevan tapi masih dikonsumsi token di setiap sesi. Jadwalkan audit Project setiap bulan:
- Hapus file yang tidak lagi relevan
- Kompres file yang sudah terlalu panjang
- Update instruksi yang sudah tidak akurat
Tips
Tandai tanggal audit di kalender — "Claude Project Cleanup" setiap awal bulan. 30 menit per bulan cukup untuk menjaga Project tetap efisien.
17. Satu Project = satu deliverable
Project yang berisi semua dokumen perusahaan — manual, SOP, data historis, brief kreatif, laporan keuangan — bukan efisiensi, itu pemborosan. Claude membaca semua konteks yang ada di Project, bahkan yang tidak relevan untuk tugas spesifik hari itu.
Prinsip: satu Project = satu deliverable atau satu area kerja yang kohesif. Konteks hanya yang benar-benar relevan untuk deliverable itu.
18. Tunjuk satu orang sebagai Claude optimizer di tim
Satu orang yang bertugas memantau penggunaan tim, mengidentifikasi pola pemborosan, dan memperbarui template prompt secara berkala. Bukan pekerjaan penuh — 30 menit per minggu cukup.
ROI-nya jelas: satu orang yang efisien dan tahu cara kerja Claude dengan baik bisa menghemat kuota yang seharusnya cukup untuk seluruh tim.
19. Gunakan model lebih rendah untuk onboarding
Saat anggota tim baru belajar pakai Claude, mereka cenderung eksperimen tanpa efisiensi — banyak prompt pendek yang vague, banyak iterasi yang tidak perlu, banyak "coba-coba" yang mengonsumsi kuota.
Selama masa onboarding (2-4 minggu pertama), arahkan ke Sonnet bukan Opus. Setelah mereka paham cara kerja Claude dan bisa menulis prompt yang efisien, baru upgrade ke model yang lebih tinggi untuk tugas yang membutuhkannya.
Kategori D: Kebiasaan yang Obvious tapi Sering Diabaikan
20. Edit output, bukan generate ulang dari nol
"Coba sekali lagi" atau "buat versi lain" = Claude generate ulang dari nol setelah membaca semua konteks percakapan dari awal. Ini salah satu pemborosan token yang paling mudah dihindari.
Alternatif: edit output yang sudah ada. Kalau memang harus generate ulang, berikan instruksi yang sangat spesifik tentang apa yang salah:
Bagian [X] terlalu panjang — pangkas jadi 2 kalimat.
Paragraf pembuka terlalu formal — tulis ulang dengan tone yang lebih casual.
Bukan: "Ini kurang bagus, coba lagi."
21. Upgrade plan hanya kalau sudah terapkan semua tips ini
Ini yang perlu dikatakan dengan jujur: kalau kamu sudah terapkan kebiasaan-kebiasaan di atas dan masih kehabisan kuota setiap hari, mungkin memang sudah waktunya upgrade.
Tanda kamu memang butuh upgrade: kamu sudah efisien, tugas harianmu genuine banyak dan kompleks, limit tercapai meskipun sudah tidak ada pemborosan yang bisa dipangkas.
Tanda kamu belum perlu upgrade: kamu belum konsisten menerapkan Tip 1-5, percakapanmu cenderung panjang dan sering ganti topik tanpa buka chat baru, kamu masih sering minta Claude "coba lagi" tanpa feedback spesifik.
22. Ingat bahwa limit reset harian, bukan bulanan
Banyak orang panik karena tidak tahu kapan limit reset. Claude Pro menggunakan limit berbasis penggunaan harian — bukan akumulasi bulanan yang sekali habis selesai untuk satu bulan.
Strategi praktis: distribusikan tugas berat ke beberapa hari. Jangan semuanya dalam satu sesi marathon yang menguras limit harian di pagi hari. Tugas yang bisa ditunda ke besok, tunda — limit besok penuh lagi.
23. Evaluasi output dulu sebelum minta revisi
Minta revisi = Claude baca ulang semua + generate lagi. Kalau kamu meminta revisi karena belum baca outputnya dengan teliti, itu token terbuang yang bisa dihindari.
Sebelum minta revisi apapun: baca output secara lengkap, identifikasi persis apa yang perlu diubah, baru kirim instruksi revisi yang sangat spesifik:
Revisi hanya bagian ini: [kutip bagian spesifik]
Yang perlu diubah: [penjelasan konkret]
Yang sudah bagus: [bagian lain] — jangan ubah.
3 Kebiasaan Prioritas untuk Mulai Minggu Ini
Kalau belum tahu mau mulai dari mana, terapkan tiga ini dulu — dampak paling besar dengan effort paling kecil:
1. Tip 3 — Prompt pendek + minta Claude tanya Langsung terasa dalam satu hari. Setiap percakapan jadi lebih efisien karena Claude mendapat konteks yang tepat lewat pertanyaan, bukan asumsi dari prompt vague.
2. Tip 2 — Rencanakan di Chat, bangun di Cowork Mengubah cara kerja fundamentalmu dengan Cowork. Satu shift kebiasaan ini bisa mengurangi iterasi yang tidak perlu secara signifikan.
3. Tip 1 — Konversi file sebelum upload Satu kebiasaan yang bisa menghemat puluhan ribu token per minggu — terutama kalau kamu sering bekerja dengan dokumen yang sama.
Tanda Kamu Sudah Lebih Efisien
Setelah kebiasaan-kebiasaan ini tertanam, kamu akan mulai melihat perbedaannya:
- Pesan "limit tercapai" muncul lebih jarang — atau tidak sama sekali — sebelum akhir hari
- Prompt yang kamu kirim makin pendek, tapi output yang kamu terima makin akurat dan relevan
- Kamu mulai secara instinktif membuka chat baru setiap ganti topik, tanpa perlu diingatkan
- Sesi Cowork selesai lebih cepat karena Claude tidak perlu bolak-balik klarifikasi instruksi
- Kamu tahu persis apa yang mau direvisi sebelum mengirim instruksi revisi
Checklist 23 Kebiasaan
- [ ] Tip 1: Konversi file ke .md sebelum upload
- [ ] Tip 2: Rencanakan di Chat, bangun di Cowork
- [ ] Tip 3: Prompt pendek + minta Claude yang tanya
- [ ] Tip 4: Jawab dengan suara, bukan mengetik
- [ ] Tip 5: Topik baru = chat baru
- [ ] Tip 6: Minta output ringkas secara eksplisit
- [ ] Tip 7: Upload file penting ke Project, bukan upload ulang ke setiap chat
- [ ] Tip 8: Pakai model yang tepat untuk tugas yang tepat
- [ ] Tip 9: Kompres file about-me di bawah 2.000 token
- [ ] Tip 10: Instruksi dalam bullet point, bukan prosa panjang
- [ ] Tip 11: Batch tugas serupa dalam satu sesi
- [ ] Tip 12: Mulai chat baru dari summary kalau percakapan sudah sangat panjang
- [ ] Tip 13: Pakai Extended Thinking hanya untuk tugas yang benar-benar kompleks
- [ ] Tip 14: Simpan prompt template sebagai file, bukan paste ulang
- [ ] Tip 15: Standardisasi prompt di seluruh tim
- [ ] Tip 16: Audit dan bersihkan Project context setiap bulan
- [ ] Tip 17: Satu Project = satu deliverable
- [ ] Tip 18: Tunjuk satu orang sebagai Claude optimizer di tim
- [ ] Tip 19: Gunakan model lebih rendah untuk onboarding tim baru
- [ ] Tip 20: Edit output yang ada, bukan generate ulang dari nol
- [ ] Tip 21: Upgrade plan hanya kalau sudah terapkan semua tips ini
- [ ] Tip 22: Ingat bahwa limit reset harian — distribusikan tugas berat
- [ ] Tip 23: Evaluasi output dulu, baru minta revisi yang spesifik
Efisiensi bukan soal pakai Claude lebih sedikit — tapi soal setiap token yang kamu pakai menghasilkan output yang benar-benar kamu butuhkan. Dua puluh tiga kebiasaan di atas tidak membatasi apa yang bisa kamu lakukan dengan Claude. Mereka memastikan lebih banyak dari apa yang kamu lakukan benar-benar sampai ke tujuan.