Одно слово, которое сломало нам стилевой профиль
Мы скормили нашей системе 76 статей Фонтанки, разложили стиль на 12 аспектов, сгенерировали правила. Прогнали первую новость. Получили технически правильный текст, который читался как РИА Новости в парике Фонтанки.

Стали разбираться, где именно ломается. Нашли конкретное место.
В пресс-релизе СК написано «подросток». Фонтанка написала «мальчик». Одно слово – и весь текст зазвучал по-другому. «Мальчик» рядом с «был завербован» – это столкновение детского с казённым. Читатель держит в голове ребёнка и террориста одновременно. Фонтанка так работает – показывает, а не объясняет.
Наш аспект VOICE_AND_TONE выдал «нейтрально-информационный тон». Формально – верно. По сути – мимо нахрен. Потому что «мальчик» в этом контексте – редакторское решение, а не стилистическая характеристика. Попробуй запиши это в правило: «выбирай слово с меньшей официальностью рядом с казённым термином». Иногда Фонтанка пишет абсолютно сухо, и «мальчик» там будет неуместен.
Аспекты ловят структуру. Длину предложений, залог, атрибуцию. Лексические решения – те, которые создают голос – им недоступны.
Мы увеличиваем количество примеров в промпте и подбираем их по тематическому тегу. Криминал к криминалу, городские истории к городским. Модель имитирует конкретный образец точнее, чем следует абстрактному правилу. Но имитация и понимание – разные вещи. Для MVP мы воспроизводим структуру стиля точно, голос – приблизительно. И говорим об этом прямо.





Комментарии