Giang Đinh

Giang Đinh

Multipotentialite · Lifelong learner

Quay lại danh sách bài viết

Một số cách tiết kiệm Token khi dùng Claude (bonus lệnh CLI Claude Code)

·
#tech

Khái niệm cơ bản:

  • Token là gì:
    • Token nôm na là đơn vị nhỏ nhất của ngôn ngữ (khoảng 3/4 một từ).
    • Mỗi lần gửi tin nhắn mới, Claude phải đọc lại TOÀN BỘ lịch sử cuộc chat từ đầu.
  • Thực trạng tiêu tốn:
    • Khoảng 98,5% token bị tiêu tốn cho việc đọc lại lịch sử cũ.
    • Chỉ có 1,5% thực sự dành cho việc tạo phản hồi mới.
  • Ví dụ minh họa:
    • Giống như thuê người viết báo cáo nhưng mỗi lần sửa một chữ họ phải đọc lại từ trang đầu tiên.

10 Tips tiết kiệm token:

1. Dùng Edit thay vì nhắn tin sửa:

  • Thay vì gõ “Sửa lại ý này cho tôi” làm dài thêm lịch sử, hãy nhấn icon chỉnh sửa ở tin nhắn gốc.
  • Hành động Edit + Resubmit sẽ thay thế nội dung cũ thay vì nhân bản nó.
  • Giúp tiết kiệm được kha khá token ngữ cảnh.

2. Mở chat mới định kỳ:

  • Khi hội thoại quá dài, Claude bị phân tán sự chú ý dẫn đến quên yêu cầu hoặc làm việc cẩu thả.
  • Áp dụng quy tắc 12%: cứ sau 10-15 tin nhắn thì nên tạo cuộc trò chuyện mới.
  • Trước khi đóng chat, hãy yêu cầu Claude tóm tắt để mang sang chat mới.

3. Gộp nhiều yêu cầu:

  • Thay vì gửi 3 tin riêng cho 3 tác vụ, hãy viết hết vào một prompt duy nhất.
  • Claude sẽ nhìn được bức tranh toàn cảnh tốt hơn.
  • Bạn chỉ phải tải ngữ cảnh một lần duy nhất.

4. Tải file vào Project:

  • Thay vì tải cùng một PDF vào nhiều chat khác nhau, hãy dùng tính năng Project để lưu trữ tài liệu.
  • Tài liệu trong Project được lưu vào cache.
  • Các cuộc hội thoại bên trong có thể tham chiếu đến mà không tốn thêm token.

5. Setup Custom Instructions:

  • Lưu sẵn vai trò, phong cách hành văn và cài đặt cá nhân trong phần thiết lập người dùng.
  • Giúp bạn khỏi phải nhắc lại “Bạn là một chuyên gia…” trong mỗi lần chat.
  • Tiết kiệm được kha khá tin nhắn thiết lập ban đầu.

6. Chọn đúng model:

  • Không phải việc gì cũng cần “dao mổ trâu”.
  • Dùng Haiku cho việc đơn giản, Sonnet cho công việc hằng ngày.
  • Dùng Opus cho tư duy chuyên sâu phức tạp.

7. Hiểu Rolling Window:

  • Claude tính giới hạn theo cửa sổ 5 tiếng liên tục kể từ tin nhắn đầu tiên, không reset vào nửa đêm.
  • Hãy né giờ cao điểm của Mỹ (19:00 đến 01:00 sáng giờ VN).
  • Tận dụng buổi sáng và ban ngày tại Việt Nam để làm việc hiệu quả nhất.

8. Theo dõi tiêu thụ:

  • Có thể dùng tool mã nguồn mở để đọc file JSONL hoặc vào mục Usage để kiểm tra lượng token đã xài.
  • Nếu dùng nhiều, hãy cân nhắc chế độ thanh toán bổ sung (Pay-as-you-go).
  • Giúp công việc không bị ngắt quãng khi hết hạn mức.

9. Dùng CLAUDE.md:

  • Tạo file CLAUDE.md ở thư mục gốc project để lưu context cố định như stack hay conventions.
  • File này được cache sẵn, Claude nhớ xuyên suốt các session.
  • Không cần nhắc lại “Đây là dự án React…” mỗi lần mở chat mới.

10. Chuyển sang Markdown:

  • Claude không cần layout hay màu sắc mà chỉ cần nội dung văn bản thuần túy.
  • Chuyển HTML hoặc PDF sang Markdown trước khi nạp.
  • Giúp tiết kiệm từ 70% đến 90% token và giúp Claude đọc chính xác hơn.

BONUS: Lệnh Claude CLI hay dùng:

  • Lợi ích:
    • Nếu xài Claude Code (CLI), dưới đây là những lệnh giúp tối ưu hóa workflow và tiết kiệm token.

Khởi động & chọn model:

  • claude: Mở chat mới.
  • claude --model claude-opus-4-5-20251101: Dùng model Opus.
  • claude -p "prompt": Chạy một lệnh rồi thoát.

Quản lý context (Tiết kiệm token):

  • /clear: Xóa sạch lịch sử chat để bắt đầu mới.
  • /compact: Nén context lại, chỉ giữ thông tin quan trọng.
  • /compact [hướng dẫn]: Nén với hướng dẫn cụ thể.

Tiếp tục làm việc:

  • claude --continue: Tiếp tục conversation gần nhất.
  • claude --resume: Chọn conversation cũ để tiếp tục.

Pipe file vào Claude:

  • cat file.txt | claude -p "tóm tắt file này"
  • git diff | claude -p "review code changes"

Trong chat commands:

  • /help: Xem tất cả commands.
  • /model: Đổi model giữa chừng.
  • /cost: Xem token đã xài.
  • ! <command>: Chạy shell command trong chat.

Đúc kết:

  • Tư duy sử dụng:
    • Hiểu cơ chế token giúp dùng Claude hiệu quả hơn.
    • Không phải tiết kiệm kiểu keo kiệt mà là dùng thông minh để tối ưu hóa ngân sách.
  • Lời khuyên:

    Nếu bạn xài CLI, hãy thử mấy lệnh trên để thấy workflow mượt mà hơn hẳn.