Зачем нужен поэтический корпус и как его использовать


2019. № 6, 113-127

Кирилл Михайлович Корчагин, Институт русского языка им. В. В. Виноградова РАН
(Россия, Москва), stivendedal@gmail.com

Аннотация:

Поэтический корпус в составе Национального корпуса русского языка — инструмент для исследователей русской поэзии и поэтического языка. Корпус содержит обширную коллекцию русской поэзии XVIII–ХХ веков, отражает все заметные поэтические направления и продолжает пополняться. В нем присутствуют два типа разметки —
грамматическая и стиховедческая. Если первая совпадает с разметкой в основном корпусе НКРЯ, то вторая — специфична именно для поэтического корпуса. Эта разметка содержит ключевые параметры поэтического текста, среди которых метр, строфика, схема рифмовки и другие. Эти параметры позволяют производить поиск и структурировать массивы русских поэтических текстов с совпадающими формальными параметрами, автоматическим образом выполняя задачу, для решения которой раньше требовались специализированная справочная литература и/или трудоемкая обработка текстов. Использование стиховедческой разметки вместе с грамматической позволяет пользователю корпуса решать задачи, лежащие на границе лингвистики и литературоведения. Среди таковых есть и традиционные для русского стиховедения задачи — такие, как исследование истории поэтических форм, — и задачи, которые могут представлять интерес для историков языка, например исследование русского ударения. В статье показаны примеры решения обоих типов задач, а также кратко описан функционал поэтического корпуса.