Математическое и программное обеспечение новых информационных технологий
Правильная ссылка на статью:
Желтов В.П., Желтов П.В.
Средства разработки интернет-портала национального корпуса чувашского языка
// Программные системы и вычислительные методы.
2019. № 1.
С. 42-50.
DOI: 10.7256/2454-0714.2019.1.28131 URL: https://nbpublish.com/library_read_article.php?id=28131
Читать статью
Результаты процедуры рецензирования статьи:
Результаты процедуры повторного рецензирования статьи:
|
|
Аннотация:
Предмет исследования – обоснование технико-эксплуатационных характеристик и средств разработки интернет-портала национального корпуса чувашского языка. Методология исследования основана на сочетании теоретического и практического подходов с применением методов анализа, сравнения, обобщения, синтеза, программирования. Актуальность исследования обусловлена важностью изучения и сохранения многообразия языков и культур в современном мире и, соответственно, необходимостью разработки средств хранения и обработки текстов на естественных языках (включая чувашский), в том числе на базе компьютерных технологий. Новизна разработки интернет-портала национального корпуса чувашского языка определяется некоторыми особенностями языка. Научная новизна, связана с разработкой интернет-портала чувашского языка, включающего поисковик, морфологический анализатор, синтаксический анализатор, семантический анализатор, тезаурус. Структура портала – главная страница, вкладки «Поисковик», «Морфологический анализатор», «Синтаксический анализатор», «Семантический анализатор», «Тезаурус». Средства разработки: платформа Microsoft.NET Framework; технология ASP.NET MVC; язык C#; среда разработки Visual Studio; база данных SQL; ADO.NET; Entity framework; Java Script; библиотека jQuery и фреймворк Angular JS; HTML/CSS. Интернет-портал чувашского языка предоставляет исследователям новый инструментарий, который не был доступен для чувашского языка ранее Интернет-портал позволяет проверять гипотетические теории, как способом обратной связи, так и современными формализованными и количественными методами. Благодаря этому возможен переход на новый качественный уровень в лексикологии и лексикографии: значительно облегчится работа по составлению словарей и тезаурусов чувашского языка, во время которой необходимо учитывать, как практические, так и теоретические составляющие.
Ключевые слова:
семантический анализатор, синтаксический анализатор, морфологический анализатор, поисковик, средства разработки, чувашский язык, интернет-портал, русский язык, национальный корпус, тезаурус
Abstract:
The subject of the research is the substantiation of the technical and operational characteristics and development means of the Internet portal of the national Chuvash language corpus. The research methodology is based on a combination of theoretical and practical approaches using the methods of analysis, comparison, synthesis, synthesis, programming.The relevance of the study is due to the importance of studying and preserving the diversity of languages and cultures in the modern world and, accordingly, the need to develop tools for storing and processing texts in natural languages (including Chuvash), including those based on computer technologies.The novelty of the development of the Internet portal of the national corpus of the Chuvash language is determined by some features of the language. Scientific novelty associated with the development of the Chuvash language Internet portal, including a search engine, morphological analyzer, syntax analyzer, semantic analyzer, thesaurus. The structure of the portal - the main page, tabs "Search", "Morphological Analyzer", "Syntax Analyzer", "Semantic Analyzer", "Thesaurus". Development Tools: Microsoft .NET Framework; ASP.NET MVC technology; C# language; Visual Studio development environment; SQL database; ADO.NET; Entity framework; Java script; jQuery library and Angular JS framework; HTML/CSS.The Chuvash Internet portal provides researchers with a new toolkit that was not available to the Chuvash language before. The Internet portal allows you to test hypothetical theories using both feedback and modern formalized and quantitative methods. Due to this, a transition to a new qualitative level in lexicology and lexicography is possible: the work on compiling dictionaries and thesauruses of the Chuvash language, during which it is necessary to take into account both practical and theoretical components, will be greatly facilitated.
Keywords:
semantic analyzer, syntax analyzer, morphological analyzer, search engine, development tools, Internet portal, Chuvash language, Russian language, national corpus, thesaurus