Калейдоскоп
04 февраля 2025, 17:25 | Автор: Олег Клейст

В России ИИ прочитал зачеркнутые слова Пушкина (ФОТО)

Рукопись Пушкина
фото:
За проект отвечают специалисты отдела «Зрительные системы» ФИЦ ИУ РАН.

Завотделом «Зрительные системы» ФИЦ ИУ РАН Дмитрий Николаев в беседе со СМИ рассказал о том, что нейросеть смогла распознать строки, которые были зачеркнуты в рукописях Александра Пушкина и ранее вызывавшие разночтения.

Как сообщает со ссылкой на его слова RTVI, сначала ИИ обучили на “Болдинской рукописи” зачеркивать не зачеркнутые слова, а потом читать зачеркнутые.  Программисты смогли создать платформу для статистического исследования русского языка.

Организатором проекта выступил директор Института проблем передачи информации (ИППИ РАН) Андрей Соболевский и академик РАН Владимир Плунгян.

Команды лингвистов появились в  ВШЭ, Институте русского языка им. Виноградова и ИППИ РАН. Затем, уже в рамках проекта в области зрительного интеллекта, к ним присоединился лингвист и пушкинист Николай Перцов.

Задачей было распознать, что скрывается в «автографа» поэта. За годы прочтений рукописных текстов поэта скопились ошибки в распознавании его почерка.

«Обнаружение каждого такого несоответствия — это маленькое открытие, а иногда и не маленькое», — пояснил Николаев.

По его мнению, это дает ученым возможность  ревизии уже существующих знаний.

Так, в одном из предложений знаменитой статьи “О народности в литературе” упоминаются трагедии из “итальянских новелл”,  хотя Пушкин писал об итальянских повестях.

«Ценно использовать искусственный интеллект как инструмент исследователя, позволяющий увидеть больше возможных вариантов прочтения и предложить для анализа новый, не изученный ранее вариант», — считает Николаев.

По словам эксперта, сейчас команда планирует обратиться в Пушкинский дом ИРЛИ РАН, чтобы получить возможность обучить нейросеть на всем материале, который есть у пушкинистов.

Николаев пояснил, что первым этапом было использование генеративно-состязательной сеть (GAN), комплекса из двух нейросетей, одна из которых синтезирует тот или иной образ, а вторая отличает сгенерированный образ от реального.

На втором этапе на полученных изображениях обучалась основная нейросеть, чтобы та могла снимать зачеркивания. Здесь использовалась нейросетевая архитектура “Да Винчи” от Smart Engines.

В итоге получилась программа, которая обрабатывает рукопись с зачеркиваниями и показывает, как зачеркнутые слова выглядели до зачеркивания.

Пушкин ИИ

Однако, во избежание ошибок, итоги изучали текстологи, хорошо знакомым с почерком Пушкина, чтобы решить, похоже или нет.

Ранее Topnews писал, что Институт Пушкина выбрал слово 2024 года.

Следите за событиями дня в нашем паблик-аккаунте в Telegramm
материалы ПО ТЕМЕ
Рукопись Пушкина NYT: из библиотек Европы серийно крадут редкие издания Пушкина
Пушкин Сказку Пушкина предложили запретить из-за пропаганды ЛГБТ*
 
топ НОВОСТЕЙ
Все новости раздела
новости Калейдоскоп
Все новости раздела