Một số cách tiết kiệm Token khi dùng Claude (bonus lệnh CLI Claude Code)
·
#tech
Khái niệm cơ bản:
- Token là gì:
- Token nôm na là đơn vị nhỏ nhất của ngôn ngữ (khoảng 3/4 một từ).
- Mỗi lần gửi tin nhắn mới, Claude phải đọc lại TOÀN BỘ lịch sử cuộc chat từ đầu.
- Thực trạng tiêu tốn:
- Khoảng 98,5% token bị tiêu tốn cho việc đọc lại lịch sử cũ.
- Chỉ có 1,5% thực sự dành cho việc tạo phản hồi mới.
- Ví dụ minh họa:
- Giống như thuê người viết báo cáo nhưng mỗi lần sửa một chữ họ phải đọc lại từ trang đầu tiên.
10 Tips tiết kiệm token:
1. Dùng Edit thay vì nhắn tin sửa:
- Thay vì gõ “Sửa lại ý này cho tôi” làm dài thêm lịch sử, hãy nhấn icon chỉnh sửa ở tin nhắn gốc.
- Hành động Edit + Resubmit sẽ thay thế nội dung cũ thay vì nhân bản nó.
- Giúp tiết kiệm được kha khá token ngữ cảnh.
2. Mở chat mới định kỳ:
- Khi hội thoại quá dài, Claude bị phân tán sự chú ý dẫn đến quên yêu cầu hoặc làm việc cẩu thả.
- Áp dụng quy tắc 12%: cứ sau 10-15 tin nhắn thì nên tạo cuộc trò chuyện mới.
- Trước khi đóng chat, hãy yêu cầu Claude tóm tắt để mang sang chat mới.
3. Gộp nhiều yêu cầu:
- Thay vì gửi 3 tin riêng cho 3 tác vụ, hãy viết hết vào một prompt duy nhất.
- Claude sẽ nhìn được bức tranh toàn cảnh tốt hơn.
- Bạn chỉ phải tải ngữ cảnh một lần duy nhất.
4. Tải file vào Project:
- Thay vì tải cùng một PDF vào nhiều chat khác nhau, hãy dùng tính năng Project để lưu trữ tài liệu.
- Tài liệu trong Project được lưu vào cache.
- Các cuộc hội thoại bên trong có thể tham chiếu đến mà không tốn thêm token.
5. Setup Custom Instructions:
- Lưu sẵn vai trò, phong cách hành văn và cài đặt cá nhân trong phần thiết lập người dùng.
- Giúp bạn khỏi phải nhắc lại “Bạn là một chuyên gia…” trong mỗi lần chat.
- Tiết kiệm được kha khá tin nhắn thiết lập ban đầu.
6. Chọn đúng model:
- Không phải việc gì cũng cần “dao mổ trâu”.
- Dùng Haiku cho việc đơn giản, Sonnet cho công việc hằng ngày.
- Dùng Opus cho tư duy chuyên sâu phức tạp.
7. Hiểu Rolling Window:
- Claude tính giới hạn theo cửa sổ 5 tiếng liên tục kể từ tin nhắn đầu tiên, không reset vào nửa đêm.
- Hãy né giờ cao điểm của Mỹ (19:00 đến 01:00 sáng giờ VN).
- Tận dụng buổi sáng và ban ngày tại Việt Nam để làm việc hiệu quả nhất.
8. Theo dõi tiêu thụ:
- Có thể dùng tool mã nguồn mở để đọc file JSONL hoặc vào mục Usage để kiểm tra lượng token đã xài.
- Nếu dùng nhiều, hãy cân nhắc chế độ thanh toán bổ sung (Pay-as-you-go).
- Giúp công việc không bị ngắt quãng khi hết hạn mức.
9. Dùng CLAUDE.md:
- Tạo file
CLAUDE.mdở thư mục gốc project để lưu context cố định như stack hay conventions. - File này được cache sẵn, Claude nhớ xuyên suốt các session.
- Không cần nhắc lại “Đây là dự án React…” mỗi lần mở chat mới.
10. Chuyển sang Markdown:
- Claude không cần layout hay màu sắc mà chỉ cần nội dung văn bản thuần túy.
- Chuyển HTML hoặc PDF sang Markdown trước khi nạp.
- Giúp tiết kiệm từ 70% đến 90% token và giúp Claude đọc chính xác hơn.
BONUS: Lệnh Claude CLI hay dùng:
- Lợi ích:
- Nếu xài Claude Code (CLI), dưới đây là những lệnh giúp tối ưu hóa workflow và tiết kiệm token.
Khởi động & chọn model:
claude: Mở chat mới.claude --model claude-opus-4-5-20251101: Dùng model Opus.claude -p "prompt": Chạy một lệnh rồi thoát.
Quản lý context (Tiết kiệm token):
/clear: Xóa sạch lịch sử chat để bắt đầu mới./compact: Nén context lại, chỉ giữ thông tin quan trọng./compact [hướng dẫn]: Nén với hướng dẫn cụ thể.
Tiếp tục làm việc:
claude --continue: Tiếp tục conversation gần nhất.claude --resume: Chọn conversation cũ để tiếp tục.
Pipe file vào Claude:
cat file.txt | claude -p "tóm tắt file này"git diff | claude -p "review code changes"
Trong chat commands:
/help: Xem tất cả commands./model: Đổi model giữa chừng./cost: Xem token đã xài.! <command>: Chạy shell command trong chat.
Đúc kết:
- Tư duy sử dụng:
- Hiểu cơ chế token giúp dùng Claude hiệu quả hơn.
- Không phải tiết kiệm kiểu keo kiệt mà là dùng thông minh để tối ưu hóa ngân sách.
- Lời khuyên:
Nếu bạn xài CLI, hãy thử mấy lệnh trên để thấy workflow mượt mà hơn hẳn.