TATSY.PRO блог

Как экономить токены в Claude

То ли Claude стал очень жадным, то ли я стал что-то делать неправильно. Тарифа за 20$ стало хватать на 1 час аккуратной работы. Я встал перед выбором: платить 100-200$ или оптимизироваться.
Изучил лучшие практики токен-менеджмента и свёл их в набор правил. Ниже семнадцать привычек, которые позволяют не упираться в лимит. Половина из них из официальной документации Anthropic, половина -- из живой практики.
1. Конвертируйте файлы перед загрузкой. Одна страница PDF съедает 1500–3000 токенов (данные из доков Anthropic). Тот же текст в markdown укладывается в 200. Откройте doc.new в адресной строке браузера, вставьте текст, скачайте как .md.
2. Планируйте в Chat, собирайте в Cowork. Anthropic подтвердил: создание файлов тратит больше лимита, чем обычный чат. Сначала согласуйте структуру в Chat, потом переходите в Cowork только на сборку.
3. Просите Claude задавать вопросы. Формулировка «задай мне вопросы через AskUserQuestion» превращает диалог в клики по вариантам. Клик стоит почти ноль токенов, печать ответа на 800 слов стоит 800 токенов.
4. Не переделывайте весь ответ. Если ошибка в третьем разделе, пишите «переделай только раздел 3, остальное оставь». Иначе платите за переписывание 2000 токенов отчёта вместо 300.
5. Объединяйте задачи в одно сообщение. Три отдельных запроса = три полных перечитывания контекста. Один запрос с тремя задачами = одно.
6. Используйте библиотеку промптов. Оставляйте стабильную структуру, меняйте только переменную часть. Похожие промпты частично кэшируются.
7. Редактируйте сообщение, а не пишите следом. В Chat кнопка «Edit» заменяет старое сообщение, а не добавляет новое. Каждое «нет, я имел в виду» удлиняет историю.
8. Выбирайте модель под задачу. Haiku и Sonnet для проверки текста, Opus с Extended Thinking — для реальной работы. Чат на Opus стоит в пять раз дороже, чем на Haiku.
9. Держите ABOUT ME коротким. Cowork читает вашу папку перед каждой задачей. Раздутый файл на 22 000 слов умножается на десять сессий в день.
10. Перезапускайте, а не уточняйте. Когда Cowork ошибся, кнопка «Restart from here» обнуляет ветку. Сессия из 30 сообщений сжигает около 230 000 токенов.
11. Резюмируйте каждые 15–20 сообщений. Попросите Claude собрать ключевое, скопируйте, откройте новый чат. Один разработчик измерил свою сессию: 88% токенов ушло на перечитывание истории.
12. Не закидывайте всю папку. Прикладывайте только то, что нужно для конкретной задачи. Лишние файлы заставляют Claude суммаризировать вместо ответа.
13. Новая тема — новый чат. Спросили про пост в LinkedIn, потом про коммерческое предложение в том же чате? Claude перечитывает LinkedIn каждый раз, когда думает о КП.
14. Выключайте лишние фичи. Web search и коннекторы добавляют токены. Включайте их под задачу, а не глобально.
15. Используйте Projects для повторяющихся файлов. Anthropic подтвердил: контент в Projects кэшируется и не считается так же, как обычные вложения. Один файл, один раз, все чаты внутри проекта его видят.
16. Настройте Personal Preferences, отключите Memory. Без preferences каждый чат начинается с пяти сообщений на разогрев. Memory добавляет контекст в каждый запрос, даже когда он не нужен.
17. Не просите Claude о том, что он не умеет. Картинки он не рисует. Если шлёте пять описаний визуала и ждёте картинку — это пять впустую потраченных сообщений. Нужны изображения — идите в Gemini или Midjourney. Нужен поиск в реальном времени — Grok.

Готовый промпт для Personal Preferences

Половина приёмов выше работает в одну сторону: вы должны их помнить и применять. Но часть можно делегировать самому Claude. Зайдите в Settings → Profile → Personal Preferences и вставьте этот блок:
Экономия токенов:

- Не предлагай загружать PDF/DOCX/PPTX. Проси вставлять текст или markdown.
- Не переделывай весь ответ при правке. Меняй только указанный фрагмент.
- Объединяй задачи в один ответ, не дроби на сообщения.
- Если задача требует уточнений, задавай вопросы списком сразу, не по одному.
- Для новой темы предлагай новый чат.
- Длинные сессии: каждые 15–20 сообщений предлагай резюме для переноса в новый чат.
- Не дублируй контекст, который уже есть в Projects или Preferences.
Теперь Claude сам будет напоминать вам про новый чат, не предложит загрузить PDF и не разобьёт ответ на пять сообщений вместо одного.
Лимит это не наказание. Это счёт за привычки.
Подпишись в Telegram и Дзен 🧠

TATSY.PRO
Источники:
Нейросети