Текстологические исследования эпохи big data и нейронных сетей
Аннотация:
В статье анализируются возможности, открывающиеся перед филологами-древниками благодаря появлению технологий работы с большими данными. Речь идет об изучении и издании текста древнерусских рукописей традиционного содержания, необходимых для совершения богослужения. Эти рукописи существовали в огромном количестве списков и в процессе переписывания подвергались значительной текстовой унификации, что крайне затрудняет их изучение методами традиционной текстологии, опирающейся на трудоемкий анализ разночтений. Сейчас, когда появилась возможность автоматической обработки полного текста памятников, началась работа над созданием системы «Лингвистическая интеллектуальная среда» (ЛИС) – инструмента, который предоставит ряд принципиально новых возможностей для исследования славянских богослужебных текстов разных эпох. В результате будет создан корпус богослужебных текстов XI–XVII вв., полученных с помощью программы по автоматическому распознаванию текста рукописей, с разметкой и поиском. Для каждого фрагмента богослужебной книги пользователь ЛИС будет иметь возможность получить полный перечень разночтений по максимально широкому кругу рукописей. Фактически речь идет о новом типе издания памятников традиционного содержания с возможностью задавать параметры этого издания в соответствии со своими исследовательскими интересами.