Разработчики «ВКонтакте» научили нейросеть создавать заголовки
Команда прикладных исследований соцсети разработала интеллектуальную платформу, которая способна генерировать новостные заголовки на русском и английском языках.
Для ее обучения использовались тексты агентства «РИА Новости» и издания The New York Times, сообщили в пресс-службе компании. Разработчики использовали архитектуру Universal Transformer и технику компрессии данных BPE (Byte Pair Encoding) – это первая подобная модель, обученная на основе русскоязычных данных.
Чтобы сформировать уникальный заголовок, нейросети нужен только текст новости. Система обрабатывает его и формулирует заголовок из фрагментов слов – так она добивается правильных падежей и склонений, и в итоге получается связное предложение.
Так как автоматизированные метрики не всегда могут объективно оценить результат, если он кардинально отличается по форме (но не по смыслу) от оригинала, создатели провели специальное исследование, в котором показывали добровольцам новость и два заголовка к ней. По словам опрошенных, в 45% случаев машинный заголовок был не хуже оригинального, а в 15% – даже лучше.
«Исследование с добровольцами показало, что заголовки, созданные нейросетью, не всегда получаются такими же качественными, как написанные человеком. Однако мы не перестаём улучшать модель – и непременно добьемся равных результатов. Использоваться технология может для самых разных задач, связанных с удобством потребления контента – например, «ВКонтакте» ее потенциально можно применить для умного сокращения постов в ленте пользователя или создания новостных дайджестов», – пояснил Даниил Гаврилов, разработчик-исследователь «ВКонтакте».
Изображение: Lori.ru.