Текстологические исследования эпохи big data и нейронных сетей


2024. № 5, 34-47

Александр Геннадьевич Кравецкий1, Светлана Михайловна Кусмауль2, Екатерина Андреевна Мишина3, Александра Андреевна Плетнева4

Институт русского языка им. В. В. Виноградова РАН (ИРЯ РАН) / Национальный исследовательский ядерный университет «МИФИ» (НЯУ МИФИ) (Россия, Москва) 

krav62@mail.ru1, kusmauls@yandex.ru2, kmishina@mail.ru3, apletneva@list.ru4

Аннотация:

В статье анализируются возможности, открывающиеся перед филологами-древниками благодаря появлению технологий работы с большими данными. Речь идет об изучении и издании текста древнерусских рукописей традиционного содержания, необходимых для совершения богослужения. Эти рукописи существовали в огромном количестве списков и в процессе переписывания подвергались значительной текстовой унификации, что крайне затрудняет их изучение методами традиционной текстологии, опирающейся на трудоемкий анализ разночтений. Сейчас, когда появилась возможность автоматической обработки полного текста памятников, началась работа над созданием системы «Лингвистическая интеллектуальная среда» (ЛИС) – инструмента, который предоставит ряд принципиально новых возможностей для исследования славянских богослужебных текстов разных эпох. В результате будет создан корпус богослужебных текстов XI–XVII вв., полученных с помощью программы по автоматическому распознаванию текста рукописей, с разметкой и поиском. Для каждого фрагмента богослужебной книги пользователь ЛИС будет иметь возможность получить полный перечень разночтений по максимально широкому кругу рукописей. Фактически речь идет о новом типе издания памятников традиционного содержания с возможностью задавать параметры этого издания в соответствии со своими исследовательскими интересами. 

Для цитирования:

Кравецкий А. Г., Кусмауль С. М., Мишина Е. А., Плетнева А. А. Текстологические исследования эпохи big data и нейронных сетей // Русская речь. 2024. № 5. С. 34–47. DOI: 10.31857/S0131611724050035.

Благодарности:

Работа выполнена в рамках программы Приоритет 2030 НИЯУ МИФИ