Atasi Batas Penggunaan Claude

Kenapa Kreditmu Cepat Habis

Kamu bayar Claude setiap bulan. Tapi entah kenapa kuota sudah hampir habis sebelum jam 3 sore.

Ini bukan bug. Ini ada penjelasannya — dan setelah kamu tahu, kebiasaan pakaimu akan berubah cukup signifikan.

Root cause yang kebanyakan orang tidak tahu: setiap kali kamu kirim pesan baru, Claude tidak hanya membaca pesan terbarumu. Dia membaca ulang seluruh percakapan dari awal — setiap pesan yang pernah dikirim dalam thread itu.

Pesan pertamamu murah. Pesan ke-30? Claude harus baca 29 pertukaran sebelumnya dulu, baru mulai menjawab. Semakin panjang percakapan, semakin mahal setiap pesan berikutnya.

Satu konsep yang perlu kamu pegang: token — satuan teks yang dipakai Claude untuk mengukur input dan output, kira-kira satu kata per token. Semua batas penggunaan Claude diukur dalam token. Semua tips di panduan ini punya satu tujuan yang sama: hindari buang-buang token untuk hal yang tidak perlu, supaya sisanya bisa dipakai untuk yang benar-benar penting.

Setiap pesan baru = Claude baca ulang seluruh percakapan dari awal

23 Kebiasaan untuk Hemat Token Claude

Kategori A: Kebiasaan yang Jarang Diketahui

1. Konversi file sebelum diupload

PDF satu halaman bisa menelan 1.500–3.000 token. Screenshot penuh bisa lebih lagi. Kalau kamu upload file yang sama ke empat percakapan berbeda dalam satu minggu, kamu sudah buang ratusan ribu token hanya untuk satu dokumen.

Solusinya sederhana: ekstrak teks yang relevan dari dokumen, paste ke file .md atau .txt bersih, baru upload. Workflow praktis: buka doc.new → paste teks → download sebagai Markdown. Claude membaca teks jauh lebih efisien dari PDF yang penuh formatting.

Konversi PDF ke markdown sebelum upload — hemat ribuan token

2. Rencanakan di Chat, bangun di Cowork

Pembuatan file — spreadsheet, dokumen panjang, presentasi — mengonsumsi limit lebih banyak dari chat biasa. Kalau kamu langsung buka Cowork dan minta Claude "buat financial model lengkap" tanpa brief yang jelas, kamu akan habiskan banyak token untuk iterasi yang seharusnya bisa diselesaikan di Chat dulu.

Rencanakan dulu di Claude Chat: struktur dokumen, section yang dibutuhkan, asumsi yang perlu dimasukkan. Setelah tahu persis apa yang diinginkan, baru pindah ke Cowork untuk eksekusi. Prinsipnya: thinking di produk yang murah, building di produk yang mahal.

Rencana di Chat dulu, baru eksekusi di Cowork

3. Tulis prompt pendek, minta Claude yang tanya

Prompt 500 kata mengonsumsi 500 token — dan dibaca ulang setiap kali kamu kirim pesan berikutnya. Alternatif yang jauh lebih hemat:

Aku mau buat [jenis konten]. Tanya aku satu per satu untuk
dapatkan informasi yang kamu butuhkan sebelum mulai.

Klik pilihan jawaban hampir tidak ada token-nya. Mengetik paragraf instruksi panjang sangat mahal. Biarkan Claude yang menggali konteks lewat pertanyaan terstruktur — kamu cukup jawab singkat.

4. Jawab dengan suara, bukan mengetik

Ini counterintuitive tapi efektif. Saat mengetik, orang cenderung menulis prompt yang terlalu pendek dan vague — karena mengetik itu ada "usaha"-nya. Prompt vague menghasilkan output yang meleset, kamu kirim koreksi, Claude baca semua dari awal lagi, dan siklus ini terus berputar.

Saat berbicara, kamu secara alami memberikan lebih banyak konteks dalam satu napas. Claude mendapat informasi yang cukup dari pesan pertama, tidak perlu bolak-balik klarifikasi. Gunakan fitur dictate bawaan HP atau tools seperti Whispr Flow untuk mengubah suara menjadi teks di prompt.

5. Mulai percakapan baru untuk topik baru

Percakapan yang sudah panjang membuat setiap pesan baru makin mahal. Kalau kamu ganti topik di percakapan yang sudah 40 pesan, Claude tetap membaca 40 pesan lama itu meskipun sama sekali tidak relevan untuk topik barumu.

Biasakan: topik baru = chat baru. Untuk Cowork: task baru = task baru, bukan dilanjutkan di task lama yang sudah panjang.

6. Minta output ringkas secara eksplisit

Claude default menghasilkan respons yang panjang dan elaboratif. Output panjang mahal di dua sisi: biaya untuk generate-nya, dan biaya karena dia ikut terbawa ke pesan-pesan berikutnya.

Tambahkan instruksi ini ke setiap prompt yang tidak perlu output panjang:

Jawab ringkas — maksimal 3-5 poin. Tanpa pembuka, tanpa kesimpulan.

7. Jangan upload file yang sama berulang kali

Setiap upload file = token terpakai untuk membacanya. Kalau dokumen yang sama kamu upload di lima percakapan berbeda, itu lima kali pemborosan.

Solusi: simpan dokumen penting di Project atau Cowork folder. Upload sekali, Claude bisa akses kapan saja tanpa perlu upload ulang.

8. Pakai model yang tepat untuk tugas yang tepat

Opus: analisis kompleks, keputusan penting, tulisan berkualitas tinggi
Sonnet: draft awal, rangkuman, formatting, pertanyaan faktual
Haiku: tugas sangat sederhana, respons cepat, preprocessing

Kesalahan umum: pakai Opus untuk semua hal — termasuk yang tidak butuh reasoning mendalam. Memakai model yang tepat bisa mengurangi konsumsi token hingga 40–60% untuk pekerjaan sehari-hari.

Kategori B: Kebiasaan Penggunaan yang Lebih Cerdas

9. Kompres file about-me di Cowork

File tentang-saya.md yang terlalu panjang mengonsumsi ribuan token di setiap sesi Cowork — bahkan kalau sebagian besar isinya tidak relevan untuk tugas hari itu.

Target ideal: di bawah 2.000 token. Cara kompres:

Baca file tentang-saya.md ini. Identifikasi informasi yang redundan,
outdated, atau tidak lagi relevan. Buat versi yang lebih padat —
maksimal 2.000 token — yang mempertahankan semua informasi penting
tanpa mengulangi hal yang sama dengan cara berbeda.

10. Gunakan bullet point, bukan prosa panjang

Instruksi dalam bentuk bullet point lebih efisien dari paragraf panjang — Claude memproses struktur yang jelas lebih cepat dan akurat. Instruksi yang ambigu juga menyebabkan Claude perlu mengklarifikasi sebelum mulai, yang berarti satu pertukaran ekstra yang bisa dihindari.

Sebelum: "Tolong bantu aku menulis email ke klien tentang penundaan proyek dengan tone yang profesional tapi tetap hangat dan tidak terdengar seperti kamu mencari-cari alasan tapi juga tidak terlalu defensif..."

Sesudah:

Tulis email ke klien:
- Topik: penundaan proyek 2 minggu
- Tone: profesional, tidak defensif
- Sertakan: alasan singkat + langkah selanjutnya

11. Batch tugas serupa dalam satu sesi

Kalau punya lima email klien yang perlu ditulis, kerjakan dalam satu percakapan — bukan lima chat terpisah. Konteks yang sudah dibangun di percakapan itu (gaya, instruksi, contoh) jadi investasi yang dipakai untuk semua task.

Ini kebalikan dari Tip 5: topik berbeda = chat baru. Tapi tugas serupa dalam satu topik = satu chat yang efisien.

12. Mulai chat baru dari summary kalau percakapan sudah sangat panjang

Kalau satu percakapan sudah sangat panjang dan ada banyak bagian yang tidak relevan lagi, jangan terus di thread yang sama. Salin poin-poin penting, buka chat baru, mulai dengan:

Konteks singkat: [2-3 kalimat ringkasan situasi dan keputusan yang
sudah diambil]. Dari sini, aku butuh [lanjutan task].

Claude yang mulai dari clean context jauh lebih efisien dari Claude yang harus menyaring puluhan pesan lama untuk menemukan yang relevan.

13. Gunakan Extended Thinking secara selektif

Extended Thinking sangat powerful tapi mengonsumsi token secara signifikan lebih banyak dari respons biasa — karena Claude menjalankan proses reasoning internal yang panjang sebelum menjawab.

Pakai ketika: keputusan kompleks dengan banyak variabel, analisis mendalam, konten berkualitas tinggi yang butuh reasoning berlapis.

Tidak perlu ketika: formatting, rangkuman singkat, pertanyaan faktual, draft cepat yang akan banyak kamu edit sendiri.

14. Simpan prompt template sebagai file, bukan paste ulang

Kalau kamu copy-paste prompt panjang yang sama di setiap chat baru, kamu membuang token yang sama berulang kali.

Simpan prompt template sebagai file di Cowork folder atau Project Instructions. Claude membaca dari file di awal sesi — tidak perlu kamu paste ulang setiap kali. Satu kali investasi, dipakai selamanya.

Kategori C: Kebiasaan Tim

15. Standardisasi prompt di seluruh tim

Setiap anggota tim yang menulis prompt berbeda-beda untuk tugas yang sama menghasilkan dua masalah sekaligus: output yang tidak konsisten, dan token terbuang untuk output yang harus direvisi berkali-kali.

Buat satu prompt template terbaik untuk setiap deliverable berulang — email klien, laporan mingguan, brief kreatif — simpan di Project yang bisa diakses semua anggota tim. Semua pakai template yang sama.

16. Audit Project context secara berkala

Project yang sudah lama punya file konteks yang outdated atau redundan — informasi yang sudah tidak relevan tapi masih dikonsumsi token di setiap sesi. Jadwalkan audit Project setiap bulan:

Hapus file yang tidak lagi relevan
Kompres file yang sudah terlalu panjang
Update instruksi yang sudah tidak akurat

Tips

Tandai tanggal audit di kalender — "Claude Project Cleanup" setiap awal bulan. 30 menit per bulan cukup untuk menjaga Project tetap efisien.

17. Satu Project = satu deliverable

Project yang berisi semua dokumen perusahaan — manual, SOP, data historis, brief kreatif, laporan keuangan — bukan efisiensi, itu pemborosan. Claude membaca semua konteks yang ada di Project, bahkan yang tidak relevan untuk tugas spesifik hari itu.

Prinsip: satu Project = satu deliverable atau satu area kerja yang kohesif. Konteks hanya yang benar-benar relevan untuk deliverable itu.

18. Tunjuk satu orang sebagai Claude optimizer di tim

Satu orang yang bertugas memantau penggunaan tim, mengidentifikasi pola pemborosan, dan memperbarui template prompt secara berkala. Bukan pekerjaan penuh — 30 menit per minggu cukup.

ROI-nya jelas: satu orang yang efisien dan tahu cara kerja Claude dengan baik bisa menghemat kuota yang seharusnya cukup untuk seluruh tim.

19. Gunakan model lebih rendah untuk onboarding

Saat anggota tim baru belajar pakai Claude, mereka cenderung eksperimen tanpa efisiensi — banyak prompt pendek yang vague, banyak iterasi yang tidak perlu, banyak "coba-coba" yang mengonsumsi kuota.

Selama masa onboarding (2-4 minggu pertama), arahkan ke Sonnet bukan Opus. Setelah mereka paham cara kerja Claude dan bisa menulis prompt yang efisien, baru upgrade ke model yang lebih tinggi untuk tugas yang membutuhkannya.

Kategori D: Kebiasaan yang Obvious tapi Sering Diabaikan

20. Edit output, bukan generate ulang dari nol

"Coba sekali lagi" atau "buat versi lain" = Claude generate ulang dari nol setelah membaca semua konteks percakapan dari awal. Ini salah satu pemborosan token yang paling mudah dihindari.

Alternatif: edit output yang sudah ada. Kalau memang harus generate ulang, berikan instruksi yang sangat spesifik tentang apa yang salah:

Bagian [X] terlalu panjang — pangkas jadi 2 kalimat.
Paragraf pembuka terlalu formal — tulis ulang dengan tone yang lebih casual.

Bukan: "Ini kurang bagus, coba lagi."

21. Upgrade plan hanya kalau sudah terapkan semua tips ini

Ini yang perlu dikatakan dengan jujur: kalau kamu sudah terapkan kebiasaan-kebiasaan di atas dan masih kehabisan kuota setiap hari, mungkin memang sudah waktunya upgrade.

Tanda kamu memang butuh upgrade: kamu sudah efisien, tugas harianmu genuine banyak dan kompleks, limit tercapai meskipun sudah tidak ada pemborosan yang bisa dipangkas.

Tanda kamu belum perlu upgrade: kamu belum konsisten menerapkan Tip 1-5, percakapanmu cenderung panjang dan sering ganti topik tanpa buka chat baru, kamu masih sering minta Claude "coba lagi" tanpa feedback spesifik.

22. Ingat bahwa limit reset harian, bukan bulanan

Banyak orang panik karena tidak tahu kapan limit reset. Claude Pro menggunakan limit berbasis penggunaan harian — bukan akumulasi bulanan yang sekali habis selesai untuk satu bulan.

Strategi praktis: distribusikan tugas berat ke beberapa hari. Jangan semuanya dalam satu sesi marathon yang menguras limit harian di pagi hari. Tugas yang bisa ditunda ke besok, tunda — limit besok penuh lagi.

23. Evaluasi output dulu sebelum minta revisi

Minta revisi = Claude baca ulang semua + generate lagi. Kalau kamu meminta revisi karena belum baca outputnya dengan teliti, itu token terbuang yang bisa dihindari.

Sebelum minta revisi apapun: baca output secara lengkap, identifikasi persis apa yang perlu diubah, baru kirim instruksi revisi yang sangat spesifik:

Revisi hanya bagian ini: [kutip bagian spesifik]
Yang perlu diubah: [penjelasan konkret]
Yang sudah bagus: [bagian lain] — jangan ubah.

3 Kebiasaan Prioritas untuk Mulai Minggu Ini

Kalau belum tahu mau mulai dari mana, terapkan tiga ini dulu — dampak paling besar dengan effort paling kecil:

1. Tip 3 — Prompt pendek + minta Claude tanya Langsung terasa dalam satu hari. Setiap percakapan jadi lebih efisien karena Claude mendapat konteks yang tepat lewat pertanyaan, bukan asumsi dari prompt vague.

2. Tip 2 — Rencanakan di Chat, bangun di Cowork Mengubah cara kerja fundamentalmu dengan Cowork. Satu shift kebiasaan ini bisa mengurangi iterasi yang tidak perlu secara signifikan.

3. Tip 1 — Konversi file sebelum upload Satu kebiasaan yang bisa menghemat puluhan ribu token per minggu — terutama kalau kamu sering bekerja dengan dokumen yang sama.

Tanda Kamu Sudah Lebih Efisien

Setelah kebiasaan-kebiasaan ini tertanam, kamu akan mulai melihat perbedaannya:

Pesan "limit tercapai" muncul lebih jarang — atau tidak sama sekali — sebelum akhir hari
Prompt yang kamu kirim makin pendek, tapi output yang kamu terima makin akurat dan relevan
Kamu mulai secara instinktif membuka chat baru setiap ganti topik, tanpa perlu diingatkan
Sesi Cowork selesai lebih cepat karena Claude tidak perlu bolak-balik klarifikasi instruksi
Kamu tahu persis apa yang mau direvisi sebelum mengirim instruksi revisi

Checklist 23 Kebiasaan

[ ] Tip 1: Konversi file ke .md sebelum upload
[ ] Tip 2: Rencanakan di Chat, bangun di Cowork
[ ] Tip 3: Prompt pendek + minta Claude yang tanya
[ ] Tip 4: Jawab dengan suara, bukan mengetik
[ ] Tip 5: Topik baru = chat baru
[ ] Tip 6: Minta output ringkas secara eksplisit
[ ] Tip 7: Upload file penting ke Project, bukan upload ulang ke setiap chat
[ ] Tip 8: Pakai model yang tepat untuk tugas yang tepat
[ ] Tip 9: Kompres file about-me di bawah 2.000 token
[ ] Tip 10: Instruksi dalam bullet point, bukan prosa panjang
[ ] Tip 11: Batch tugas serupa dalam satu sesi
[ ] Tip 12: Mulai chat baru dari summary kalau percakapan sudah sangat panjang
[ ] Tip 13: Pakai Extended Thinking hanya untuk tugas yang benar-benar kompleks
[ ] Tip 14: Simpan prompt template sebagai file, bukan paste ulang
[ ] Tip 15: Standardisasi prompt di seluruh tim
[ ] Tip 16: Audit dan bersihkan Project context setiap bulan
[ ] Tip 17: Satu Project = satu deliverable
[ ] Tip 18: Tunjuk satu orang sebagai Claude optimizer di tim
[ ] Tip 19: Gunakan model lebih rendah untuk onboarding tim baru
[ ] Tip 20: Edit output yang ada, bukan generate ulang dari nol
[ ] Tip 21: Upgrade plan hanya kalau sudah terapkan semua tips ini
[ ] Tip 22: Ingat bahwa limit reset harian — distribusikan tugas berat
[ ] Tip 23: Evaluasi output dulu, baru minta revisi yang spesifik

Efisiensi bukan soal pakai Claude lebih sedikit — tapi soal setiap token yang kamu pakai menghasilkan output yang benar-benar kamu butuhkan. Dua puluh tiga kebiasaan di atas tidak membatasi apa yang bisa kamu lakukan dengan Claude. Mereka memastikan lebih banyak dari apa yang kamu lakukan benar-benar sampai ke tujuan.