Чтобы использовать параметры языковых моделей без API, то есть прямо в текстовых промптах, можно просто грамотно формулировать запрос. Вот примеры, как это делать:
🔥 Temperature – регулирует креативность
📌 API:
{ "temperature": 0.2 }
📌 В промпте:
• “Ответь строго по фактам, без домыслов.” → Эквивалент temperature = 0.2
• “Придумай оригинальную историю с неожиданным концом.” → Эквивалент temperature = 1.5–2.0
✅ Работает, если просишь модель быть более формальной или креативной.
{ "temperature": 0.2 }
📌 В промпте:
• “Ответь строго по фактам, без домыслов.” → Эквивалент temperature = 0.2
• “Придумай оригинальную историю с неожиданным концом.” → Эквивалент temperature = 1.5–2.0
✅ Работает, если просишь модель быть более формальной или креативной.
🎯 Top-p – ограничивает разнообразие слов
📌 API:
{ "top_p": 0.3 }
📌 В промпте:
• “Используй самые вероятные слова, избегая сложных формулировок.” → Эквивалент top_p = 0.3
• “Подбери необычные, редкие слова, чтобы текст звучал интересно.” → Эквивалент top_p = 1.0
✅ Работает, если указать стиль или сложность лексики.
{ "top_p": 0.3 }
📌 В промпте:
• “Используй самые вероятные слова, избегая сложных формулировок.” → Эквивалент top_p = 0.3
• “Подбери необычные, редкие слова, чтобы текст звучал интересно.” → Эквивалент top_p = 1.0
✅ Работает, если указать стиль или сложность лексики.
📏 Max tokens – ограничивает количество слов
📌 API:
{ "max_tokens": 100 }
📌 В промпте:
• “Ответь в одном предложении.” → Эквивалент max_tokens ≈ 20
• “Дай краткий ответ в 3-4 предложения.” → Эквивалент max_tokens ≈ 50
• “Объясни подробно, с примерами.” → Эквивалент max_tokens ≈ 500+
✅ Работает, если явно указывать длину ответа.
{ "max_tokens": 100 }
📌 В промпте:
• “Ответь в одном предложении.” → Эквивалент max_tokens ≈ 20
• “Дай краткий ответ в 3-4 предложения.” → Эквивалент max_tokens ≈ 50
• “Объясни подробно, с примерами.” → Эквивалент max_tokens ≈ 500+
✅ Работает, если явно указывать длину ответа.
🛑 Stop words – принудительно останавливает генерацию
📌 API:
{ "stop": ["Конец.", "Спасибо за ответ."] }
📌 В промпте:
• “Ответь и закончи фразой: ‘Конец.’”
• “Сформулируй ответ, но не используй слова ‘нейросеть’ и ‘ИИ’.”
✅ Ограничивает модель, если чётко прописать условия.
{ "stop": ["Конец.", "Спасибо за ответ."] }
📌 В промпте:
• “Ответь и закончи фразой: ‘Конец.’”
• “Сформулируй ответ, но не используй слова ‘нейросеть’ и ‘ИИ’.”
✅ Ограничивает модель, если чётко прописать условия.
🔄 Repetition penalty – снижает тавтологию
📌 API:
{ "repetition_penalty": 1.3 }
📌 В промпте:
• “Не повторяй слова и выражения в ответе.”
• “Каждый абзац должен содержать новую информацию без дублирования.”
✅ Снижает повторения, если прямо запретить их в промпте.
{ "repetition_penalty": 1.3 }
📌 В промпте:
• “Не повторяй слова и выражения в ответе.”
• “Каждый абзац должен содержать новую информацию без дублирования.”
✅ Снижает повторения, если прямо запретить их в промпте.
🎭 Дополнительные приёмы
📌 Если нужна определённая структура ответа:
• “Ответь в формате списка из 3 пунктов.”
• “Напиши ответ в виде диалога.”
📌 Если нужна формальность:
• “Ответь официальным языком, как для научной статьи.”
• “Используй простой, разговорный стиль.”
📌 Если нужна конкретика:
• “Приведи 3 примера.”
• “Не используй общие фразы, только точные факты.”
• “Ответь в формате списка из 3 пунктов.”
• “Напиши ответ в виде диалога.”
📌 Если нужна формальность:
• “Ответь официальным языком, как для научной статьи.”
• “Используй простой, разговорный стиль.”
📌 Если нужна конкретика:
• “Приведи 3 примера.”
• “Не используй общие фразы, только точные факты.”
💡 Вывод
Всё, что можно настроить через API, можно задать и в текстовом промпте, просто правильно формулируя запрос.