Северина Е.М., Ларионова М.Ч. —
Новые филологические практики: семантическое издание текстов А. П. Чехова
// Филология: научные исследования. – 2020. – № 10.
– С. 13 - 21.
DOI: 10.7256/2454-0749.2020.10.33970
URL: https://e-notabene.ru/fmag/article_33970.html
Читать статью
Аннотация: Авторы представляют концепцию семантического цифрового издания текстов А. П. Чехова, уделяя особое внимание научно-исследовательскому проекту Chekhov Digital, который реализуется в Южном федеральном университете и Южном научном центре РАН. Цель проекта – создание семантической разметки собрания произведений писателя с опорой на стандарты цифровой публикации Text Encoding Initiative (TEI), позволяющей представить текст в виде доступных для компьютерной обработки связанных данных, а также на стандарты электронного формата русскоязычных литературных текстов, представленного в Семантическом издании текстов Л. Н. Толстого [6; 7]. Важнейшая задача проекта – предусмотреть полезные для исследователя цифровые инструменты, включая удобный семантический поиск, инструменты статистической обработки и визуализации. Основной источник – академическое Полное собрание сочинений и писем А. П. Чехова в 30 томах (1974-1983) (ПССиП). В данный момент разработана предварительная структура разметки некоторых категорий, существующих в чеховских текстах, примечаний и комментариев, описание томов ПССиП, что позволяет организовать семантический поиск исследовательской информации, сделать редакционные примечания машиночитаемыми и более приспособленными для изучения с помощью не только традиционных подходов, но и компьютерных методов. Авторы подчеркивают, что текстовая разметка будет расширяться за счет включения новых категорий, и само семантическое издание в целом будет расширять свою сеть за счет включения справочных и редакционно-критических текстов, выходящих за рамки ПССиП.
Семантическое издание Chekhov Digital дает основания для нового типа комментария, объединяющего смыслы и факты, усложняющего и обогащающего понимание текста. Такое издание представляет интерес для исследователей, преподавателей, студентов, заинтересованных читателей.
Abstract: The authors present the concept of semantic digital publication of A. P. Chekhov's texts, giving special attention to the research project Chekhov Digital implemented in Southern Federal University and the Southern Scientific Center of the Russian Academy of Sciences. The goal of the project consists in creation of semantic marling of the compilation of writer’s works supported by the standards for digital publication Text Encoding Initiative (TEI) that allows presenting the text in format that can be processed by a computer, as well as the standards for electronic format of Russian-language literary texts displayed in the Semantic edition of the texts of L. N. Tolstoy. The crucial task of the project consists in provision of digital tools useful for the researchers, including convenient semantic search, statistical processing and visualization tools. The main source is the Academic Compilation of Complete Works and Letters of A. P. Chekhov in 30 volumes (1974-1983). Currently, a preliminary structure of markup is developed for some categories that exist in Chekhov's texts, notes, commentaries, and description of the volumes of Academic Compilation of Complete Works and Letters of A. P. Chekhov, which arranging semantic search of information, make editorial notes computer-readable, and more adjusted to studying not only the traditional approach, but also computer methods. It is underlined that text markup would expand due to inclusion of new categories; and the semantic edition itself would broaden its network due to inclusion of reference and editorial-peered texts that are beyond the scope of the Academic Compilation of Complete Works and Letters of A. P. Chekhov. Semantic edition Chekhov Digital gives grounds for a new type of commentary that incorporates meanings and facts, complicates and enriches the interpretation of text. Such edition is valuable for the researchers, pedagogues, students, and audience interested in the topic.