В России ИИ прочитал зачеркнутые слова Пушкина (ФОТО)
Завотделом «Зрительные системы» ФИЦ ИУ РАН Дмитрий Николаев в беседе со СМИ рассказал о том, что нейросеть смогла распознать строки, которые были зачеркнуты в рукописях Александра Пушкина и ранее вызывавшие разночтения.
Как сообщает со ссылкой на его слова RTVI, сначала ИИ обучили на “Болдинской рукописи” зачеркивать не зачеркнутые слова, а потом читать зачеркнутые. Программисты смогли создать платформу для статистического исследования русского языка.
Организатором проекта выступил директор Института проблем передачи информации (ИППИ РАН) Андрей Соболевский и академик РАН Владимир Плунгян.
Команды лингвистов появились в ВШЭ, Институте русского языка им. Виноградова и ИППИ РАН. Затем, уже в рамках проекта в области зрительного интеллекта, к ним присоединился лингвист и пушкинист Николай Перцов.
Задачей было распознать, что скрывается в «автографа» поэта. За годы прочтений рукописных текстов поэта скопились ошибки в распознавании его почерка.
«Обнаружение каждого такого несоответствия — это маленькое открытие, а иногда и не маленькое», — пояснил Николаев.
По его мнению, это дает ученым возможность ревизии уже существующих знаний.
Так, в одном из предложений знаменитой статьи “О народности в литературе” упоминаются трагедии из “итальянских новелл”, хотя Пушкин писал об итальянских повестях.
«Ценно использовать искусственный интеллект как инструмент исследователя, позволяющий увидеть больше возможных вариантов прочтения и предложить для анализа новый, не изученный ранее вариант», — считает Николаев.
По словам эксперта, сейчас команда планирует обратиться в Пушкинский дом ИРЛИ РАН, чтобы получить возможность обучить нейросеть на всем материале, который есть у пушкинистов.
Николаев пояснил, что первым этапом было использование генеративно-состязательной сеть (GAN), комплекса из двух нейросетей, одна из которых синтезирует тот или иной образ, а вторая отличает сгенерированный образ от реального.
На втором этапе на полученных изображениях обучалась основная нейросеть, чтобы та могла снимать зачеркивания. Здесь использовалась нейросетевая архитектура “Да Винчи” от Smart Engines.
В итоге получилась программа, которая обрабатывает рукопись с зачеркиваниями и показывает, как зачеркнутые слова выглядели до зачеркивания.
Однако, во избежание ошибок, итоги изучали текстологи, хорошо знакомым с почерком Пушкина, чтобы решить, похоже или нет.
Ранее Topnews писал, что Институт Пушкина выбрал слово 2024 года.