Fine-tuning нейросети под бизнес: когда готовая модель не работает
Готовые модели вроде GPT-4o и YandexGPT отлично справляются с общими задачами. Но 68% компаний сталкиваются с проблемой: модель не знает специфику бизнеса. Юридическая фирма получает неточные формулировки. Медицинский бот путает термины. Колл-центр не понимает корпоративный стиль. Fine-tuning решает эти проблемы — модель обучается на ваших данных и начинает «думать» как ваша компания.
Когда готовая модель не хватает
| Проблема | Пример | Решение |
|---|---|---|
| Специфичная терминология | Юридические, медицинские, технические термины | Fine-tuning |
| Корпоративный стиль общения | Бот общается «как все», а не как бренд | Fine-tuning |
| Внутренние знания | Процедуры, регламенты, продукты компании | RAG или Fine-tuning |
| Узкая доменная область | Строительство, нефтедобыча, фармацевтика | Fine-tuning |
| Низкая цена при масштабе | 1M+ запросов/мес — дорого на GPT-4o | Fine-tuning маленькой модели |
Fine-tuning vs RAG vs Prompt Engineering
| Критерий | Prompt Engineering | RAG | Fine-tuning |
|---|---|---|---|
| Стоимость | Бесплатно | 20–50K₽ | 150–500K₽ |
| Скорость внедрения | 1 день | 1–2 недели | 2–4 недели |
| Качество ответов | Среднее | Хорошее | Отличное |
| Потребность в данных | Нет | База знаний | 500+ примеров |
| Поддержка | Обновление промпта | Обновление базы | Переобучение |
| Когда использовать | Простые задачи | База знаний растёт | Уникальный стиль/домен |
Простое правило: начните с промптов → если не хватает → добавьте RAG → если стиль критичен → fine-tuning.
Подготовка данных: самое важное
Качество fine-tuning на 80% зависит от качества данных.
Сколько примеров нужно
| Тип задачи | Минимум | Рекомендуемое | Оптимальное |
|---|---|---|---|
| Стиль/тон | 50 | 200 | 500+ |
| Доменные знания | 100 | 500 | 2000+ |
| Сложная логика | 200 | 1000 | 5000+ |
| Мультидоменный | 500 | 2000 | 10000+ |
Формат данных
Примеры должны быть в формате «вопрос-ответ»:
{"messages": [
{"role": "system", "content": "Ты — помощник юридической фирмы Иванов и партнёры."},
{"role": "user", "content": "Какие документы нужны для регистрации ООО?"},
{"role": "assistant", "content": "Для регистрации ООО потребуются: заявление Р11001, устав..."}
]}Критерии качества
- ✅ Реальные запросы клиентов (не выдуманные)
- ✅ Правильные ответы экспертов компании
- ✅ Разнообразие формулировок (один вопрос 3–5 способов)
- ❌ Копипаст из интернета (модель выучит чужой стиль)
- ❌ Длинные ответы (>2000 токенов — модель теряет фокус)
- ❌ Противоречивые ответы на один вопрос
Процесс fine-tuning: 7 шагов
- Сбор данных — экспорт из CRM, базы знаний, чатов поддержки
- Очистка — удаление дублей, персональных данных, мусора
- Разметка — форматирование в вопрос-ответ, валидация экспертом
- Разделение — 80% обучение, 10% валидация, 10% тест
- Обучение — запуск fine-tuning через API (OpenAI, Yandex, или self-hosted)
- Оценка — тестирование на отложенных данных, сравнение с базовой моделью
- Деплой — развёртывание в production, мониторинг качества
Стоимость по вариантам
| Вариант | Модель | Стоимость | Время |
|---|---|---|---|
| API fine-tuning | OpenAI GPT-4o mini | 50–100K₽ | 1–2 дня |
| API fine-tuning | YandexGPT | 30–80K₽ | 1–3 дня |
| Self-hosted | Qwen 2.5 7B (GPU) | 100–200K₽ + сервер | 1 неделя |
| Полный цикл с данными | Любая | 150–500K₽ | 2–4 недели |
Кейс: юридическая фирма «Право Групп»
Проблема: GPT-4o генерировал общие юридические ответы без учёта специфики российского права и стиля фирмы. Клиенты жаловались на «роботизированные» ответы.
Решение: fine-tuning YandexGPT на 2000 реальных консультаций.
Результат:
| Метрика | До (GPT-4o) | После (fine-tuned YandexGPT) |
|---|---|---|
| Точность ответов | 72% | 94% |
| Соответствие стилю | 45% | 96% |
| Стоимость 1000 запросов | $2.50 | 30 ₽ |
| Скорость ответа | 2–3 сек | 1–2 сек |
| Клиентская удовлетворённость | 68% | 91% |
Экономия: при 50 000 запросов/мес — с 125 000 ₽ до 1 500 ₽/мес (−99%).
Когда fine-tuning не нужен
Не тратьте деньги, если:
- У вас менее 50 примеров качественных данных
- Задача покрывается RAG (поиск по базе знаний)
- Достаточно улучшить промпт (добавить контекст, примеры)
- Бюджет меньше 50 000 ₽ — лучше вложить в RAG
Хотите обучить модель на данных вашей компании? Обсудим задачу — оценим, нужен ли fine-tuning или достаточно RAG.