Библиотека
|
ваш профиль |
Кибернетика и программирование
Правильная ссылка на статью:
Галимов А.А.
Разработка онтологической модели публикаций
// Кибернетика и программирование.
2015. № 2.
С. 98-106.
DOI: 10.7256/2306-4196.2015.2.14569 URL: https://nbpublish.com/library_read_article.php?id=14569
Разработка онтологической модели публикаций
DOI: 10.7256/2306-4196.2015.2.14569Дата направления статьи в редакцию: 25-02-2015Дата публикации: 17-04-2015Аннотация: Деятельность организаций, занимающихся издательской работой, а также людей, работающих в научно-исследовательской области, тесно связана с публикациями. В настоящее время в свободном доступе существует комплекс онтологий Semantic Publishing and Referencing Ontology (SPAR), который предназначен для работы с публикациями. Однако этот комплекс является англоязычным и ориентирован на работу с зарубежными источниками литературы, а прямой перевод комплекса на русский язык не решает проблему работы с российскими публикациями. В работе предложена онтологическая модель знаний, построенная на основе российских стандартов, регламентирующих основные виды изданий в РФ. Для описания классов и слотов выбраны основные типы публикаций, наиболее часто используемые в научных исследованиях. Онтология разработана в редакторе онтологий Protégé. Проведена оценка компетентности онтологии и показаны ее возможности для анализа наукометрических показателей, заполнения различных отчетов и рейтингов, составления библиографических записей. Ключевые слова: публикация, онтология, Protégé, библиография, библиографический стиль, база знаний, управление знаниями, SPAR, издательская работа, OWLAbstract: Activities of publishing organizations, as well as researches is closely related to publication. Currently, there are some complex Semantic Publishing and Referencing Ontology (SPAR) ontologies in free access, designed to work with publications. However, this complex is English-based and designed to work with foreign sources of literature. Direct translation of the complex into Russian does not solve the problem of working with Russian publications. The paper presents an ontological model of knowledge, built on the basis of Russian standards regulating the main types of publications in the Russian Federation. To describe the classes and slots the author selects main types of publications, most commonly used in scientific research. Ontology developed in Protégé ontology editor. The article evaluates the competence of the ontology and show its capabilities for analyzing scientometric indicators, filling a variety of reports and ratings, make a bibliographic records. Keywords: knowledge base, bibliographic style, bibliography, Protégé, ontology, publication, knowledge management, SPAR, publishing work, OWLВведение Организации, занимающиеся издательской работой, стремятся решить становящиеся всё более острыми проблемы формализации, структуризации и формы хранения накопленных знаний для дальнейшего удобного доступа к ним и получения всей необходимой информации одним запросом к базе знаний. Подавляющее большинство людей, занимающихся научно-исследовательской работой, также активно работают с публикациями. В соответствии с требованиями к оформлению, каждая публикация должна список использованных источников литературы. Эти списки составляются в соответствии с библиографическими стилями, причём в разных журналах требуются разные стили. Для эффективной работы с публикациями можно использовать онтологию. Созданная онтология может использоваться, например, в целях создания частной библиотеки публикаций; составления библиографических записей, ссылок и списков литературы по атрибутам публикаций; в процессе издательской работы. Анализ существующих онтологий публикаций Онтологией называется формализация некоторой области знаний с помощью такой структуры, которая содержит классы объектов (физических или абстрактных), их слоты и связи, принятые в этой области. Класс — это абстрактная группа, коллекция или набор объектов. Он может включать в себя экземпляры конкретных объектов, другие классы, либо же сочетания и того, и другого. Каждый слот (свойство, атрибут) имеет по крайней мере имя и значение и используется для хранения информации, которая специфична для объекта и привязана к нему. В качестве связей между классами обычно выступают такие атрибуты классов, значением которых является другой объект. В настоящее время в свободном доступе существует комплекс онтологий SPAR – Semantic Publishing and Referencing Ontology [1]. Он обеспечивает достаточно детальную категоризацию отношений, которые могут возникать между научными материалами в электронном виде, и воплощающими их связями. Комплекс онтологий SPAR включает онтологии семантической публикации и онтологии ссылок. Онтологии семантической публикации[2]: − FRBR-aligned Bibliographic Ontology (FaBiO) – это библиографическая онтология, совместимая с FRBR, предназначена для записи и публикации в Semantic Web библиографических научных записей; − Publication Roles Ontology (PRO) характеризует роли агентов (людей, организаций и вычислительных средств; например, автор, редактор, обозреватель, издатель, библиотекарь) в процессе публикации, позволяет записывать информацию даты/времени о том, когда исполняются эти роли; − Publications Status Ontology (PSO) описывает статус документов и других библиографических сущностей на различных этапах процесса публикации (например, представленные рукописи, отклонение рукописи, прием рукописи, версия записи); − Publications Workflow Ontology (PWO) характеризует основные этапы в рабочем процессе, связанном с публикацией документа (например, в рассмотрении, в XML формате, дизайн страницы, публикация в Интернете). Онтологии ссылок: − Citation Typing Ontology (CiTO) необходима для описания природы цитат в научно-исследовательских статьях и других академических работах, как из других публикаций, так и из информационных ресурсов Web, и для публикации этих описаний в Semantic Web; − Bibliographic Reference Ontology (BiRO) нужна для описания библиографических записей и ссылок, и их сбора в библиографические сборники и списки литературы; − Citation Counting and Context Characterization Ontology (C4O) характеризует библиографические ссылки с точки зрения их количества и контекста; − Document Components Ontology (DoCO). описывает составные части библиографического документа. Предоставляет структурированную лексику компонентов документа (например, введение, обсуждение, благодарность, список литературы, рисунки, приложения). Онтологии FaBiO, CiTO, BiRO и C4O в настоящее время находятся в открытом доступе и уже могут быть использованы, а онтологии DoCO, PRO, PSO и PWO находятся в разработке. Комплекс онтологий SPAR является англоязычным и ориентирован на работу с зарубежными источниками. Прямой перевод комплекса на русский язык не решает проблему работы с русскоязычными публикациями, так как классы и слоты комплекса отличны от тех, наличие которых необходимо для соответствия российским стандартам описания материалов, готовящихся к публикации [3,4]. Для решения этой проблемы необходима разработка новой онтологии. Разработка русскоязычной онтологии публикаций Разработка онтологии включает в себя следующие шаги: - определение области и масштаба онтологии; - выделение основных терминов онтологии; - определение классов и иерархии классов; - определение свойств классов – слотов; - определение фацетов (ограничения) слотов. Для определения классов и слотов русскоязычной онтологической модели, ориентированной на работу с российскими публикациями, проведен анализ российских стандартов, регламентирующих основные виды изданий в РФ [3,4]. Для разработки первой версии были выбраны основные типы публикаций, наиболее часто используемые в научных исследованиях. Для каждого типа публикации в онтологии определен соответствующий класс, который может конкретизироваться более низкими уровнями иерархии (подклассами). В корне иерархии классов расположен абстрактный класс "Базовый класс публикации", от которого наследуются все остальные (как абстрактные, так и не абстрактные) классы. Этот класс имеет следующие слоты, которыми описываются все типы публикаций, включенные в первую версию онтологии: - "авторы"; - "заглавие публикации"; - "сведения о заглавии"; - "универсальная десятичная классификация"; - "библиотечно-библиографическая классификация"; - "дата публикации"; - "страницы" (общее количество страниц или интервал страниц с публикацией); - "состояние публикации" (принята к публикации, в процессе создания, опубликована, отклонена); - "количество ссылок в публикации" (количество источников использованной литературы). Иерархия классов онтологии показана на рисунке 1. Рисунок 1 – Иерархия классов онтологии Слоты остальных классов дополняются к слотам базового класса, и, такой набор слотов позволяет описывать конкретные экземпляры. Например, класс "Книжная публикация" помимо "базовых" слотов будет иметь такие: - "повторность издания"; - "место издания"; - "издательство"; - "под редакцией"; - "ISBN"; - "рецензенты". Диаграмма классов показана на рисунке 2. Рисунок 2 – Диаграмма классов онтологии Онтология разработана в редакторе онтологий и фреймворке для построения баз знанийProtégé версии 3.5 [5]. Онтология представлена в виде файла проектаProtégé. Такой файл можно конвертировать в файл OWL, что позволяет использовать онтологию в других редакторах и фреймворках, например DOE [6], Fluent Editor [7]. Тестирование онтологии Для проверки компетентности онтологии был составлен набор запросов. Экранные формы этих запросов, выполненных в Protégé 3.5, приведены на рисунках 3-6. Рисунок 3 – Реализация запроса "Какие книги были опубликованы в 2013 году?"
Рисунок 4 – Реализация запроса "Какие публикации являются зарубежными?" Рисунок 5 – Реализация запроса "Научным руководителем каких диссертаций является сотрудник Орлов?". Рисунок 6 – Реализация запроса "Какие публикации публикуются еженедельно?". Результаты запросов показали, что разработанная онтологическая модель может быть использована сотрудниками кафедр вузов для анализа наукометрических показателей, заполнения различных отчетов и рейтингов, составления библиографических записей. Работа с онтологией позволяет также существенно упростить и ускорить составление библиографических списков при подготовке статей к публикации. Заключение В настоящее время проводится работа над развитием онтологии. Для формирования библиографических списков из найденных публикаций в следующую версию онтологии будет добавлен класс "Ссылки" со следующими атрибутами: "авторы", "заглавие" и "тип ссылки" (возможные значения: «прямая ссылка», «косвенная ссылка»). Добавление слота "содержит" позволит установить связь "Базовый класс публикации СОДЕРЖИТ Ссылки". По такому же принципу будет образована связь "Базовый класс публикации ИМЕЕТ Компоненты". Для этого будет добавлен класс "Компоненты" с атрибутами "тип компонента" (возможные значения: "структурные", "риторические") и "компоненты", а также слот "имеет". Добавление новых классов, описывающих типы публикаций, расширит возможности практического применения онтологии. В числе этих классов следующие: "Тезисы докладов", "Отчет о НИР", "Методическое пособие", "Составная часть документа" и "Рецензия". Расширенная версия онтологии будет полностью соответствовать российским стандартам [3,4]. Это позволит генерировать библиографические списки, включающие любые издания, опубликованные в российских источниках информации. Библиография
1. Semantic Publishing and Referencing Ontologies (SPAR) [Электронный ресурс] – Режим доступа: http://sempublishing.sourceforge.net/
2. В. А. Резниченко, Г. Ю. Проскудина, О. М. Овдий. Формальная модель научной публикации. [Электронный ресурс] / Ин-т прогр. систем НАН Украины – Режим доступа: http://nbuv.gov.ua/j-pdf/Progr_2012_2-3_41.pdf 3. ГОСТ 7.60-2003. Издания. Основные виды. [Электронный ресурс] – Режим доступа: http://www.ifap.ru/library/gost/7602003.pdf 4. ГОСТ 7.1-2003. Библиографическая запись. Библиографическое описание. Общие требования и правила составления. [Электронный ресурс] – Режим доступа: http://www.ifap.ru/library/gost/712003.pdf 5. Protégé [Электронный ресурс] – Режим доступа: http://protege.stanford.edu 6. DOE-The Differential Ontology Editor [Электронный ресурс] – Режим доступа: http://www.eurecom.fr/~troncy/DOE/ 7. Cognitum. Fluent Editor 2014 [Электронный ресурс] – Режим доступа: http://www.cognitum.eu/semantics/FluentEditor/Default.aspx References
1. Semantic Publishing and Referencing Ontologies (SPAR) [Elektronnyi resurs] – Rezhim dostupa: http://sempublishing.sourceforge.net/
2. V. A. Reznichenko, G. Yu. Proskudina, O. M. Ovdii. Formal'naya model' nauchnoi publikatsii. [Elektronnyi resurs] / In-t progr. sistem NAN Ukrainy – Rezhim dostupa: http://nbuv.gov.ua/j-pdf/Progr_2012_2-3_41.pdf 3. GOST 7.60-2003. Izdaniya. Osnovnye vidy. [Elektronnyi resurs] – Rezhim dostupa: http://www.ifap.ru/library/gost/7602003.pdf 4. GOST 7.1-2003. Bibliograficheskaya zapis'. Bibliograficheskoe opisanie. Obshchie trebovaniya i pravila sostavleniya. [Elektronnyi resurs] – Rezhim dostupa: http://www.ifap.ru/library/gost/712003.pdf 5. Protégé [Elektronnyi resurs] – Rezhim dostupa: http://protege.stanford.edu 6. DOE-The Differential Ontology Editor [Elektronnyi resurs] – Rezhim dostupa: http://www.eurecom.fr/~troncy/DOE/ 7. Cognitum. Fluent Editor 2014 [Elektronnyi resurs] – Rezhim dostupa: http://www.cognitum.eu/semantics/FluentEditor/Default.aspx |