Грушина О.А. —
Анализ современных медиатекстов на языке суахили с использованием методов корпусной лингвистики
// Litera. – 2020. – № 1.
– С. 247 - 256.
DOI: 10.25136/2409-8698.2020.1.31993
URL: https://e-notabene.ru/fil/article_31993.html
Читать статью
Аннотация: В статье рассматривается применение методов корпусной лингвистики для анализа современных медиатекстов на языке суахили. Язык СМИ репрезентативен и продуктивен для анализа и вычленения терминов и выражений, актуальных на данный момент времени и относящихся к различным сферам речепользования. Предметом исследования являются особенности выявления как единичных, так и составных медицинских терминов и выражений в медийных текстах на языке суахили путем анализа данных по частотности употребления n–грамм. Для проведения исследования автором составлен корпус медиатекстов, основой которого стали материалы интернет–издания Mtanzania Танзаниец, опубликованные в 2014–2019 гг. Для сбора материала, составления корпуса и анализа полученных данных были применены методы корпусной лингвистики и компьтерного анализа. Результаты проведенного исследования показали эффективность использования методики вычленения актуальных единичных и составных медицинских терминов путем анализа корпуса медиатекстов раздела Afya na Jamii Здравоохранение и социальная сфера при помощи системы UNIX. Неоспоримым преимуществом анализа корпуса медиатекстов является использование в них «живого» языка с лексическим наполнением, актуальным для современного периода времени. Полученные результаты могут найти в дальнейшем практическое применение: после обработки лексикографами и специалистами в области медицины выявленные термины и выражения могут использоваться для составления специализированных тематических словарей на языке суахили.
Abstract: This article examines the application of corpus linguistics techniques for analyzing modern media texts in Swahili language. The language of mass media is representative and productive for the analysis and extraction of terms referred to the various spheres of speech use. The subject of this research is the peculiarities of determination of simple and compound medical terms and phrases in the Swahili language media texts by analyzing data on the frequency of using n-gram. To undertake this study, the author comprised the body of media texts based on the materials of Mtanzania newspaper published in 2014-2019. The methods of corpus linguistics and computer analysis were applied for collection of materials and analysis of the acquired data. The results of the conducted research demonstrated the effectiveness of the use of extraction technique if the relevant simple and compound medical terms by analyzing the body of media texts of the section Afya na Jamii, healthcare and social sphere using the UNIX system. An undeniable advantage of analysis of the body of media texts is the use of a “living” language with lexical saturation relevant for the present time. The obtained results may find future practical application: after processing by the lexicographers and experts in the area of medicine, the discovered terms and phrases can be used for composing specialized thematic dictionaries in Swahili language.