Библиотека
|
ваш профиль |
Исторический журнал: научные исследования
Правильная ссылка на статью:
Тришин И.Г.
База данных в исследовании истории усадеб Подмосковья: наполнение, обогащение и аналитика
// Исторический журнал: научные исследования.
2023. № 3.
С. 29-39.
DOI: 10.7256/2454-0609.2023.3.39859 EDN: YZFHCY URL: https://nbpublish.com/library_read_article.php?id=39859
База данных в исследовании истории усадеб Подмосковья: наполнение, обогащение и аналитика
DOI: 10.7256/2454-0609.2023.3.39859EDN: YZFHCYДата направления статьи в редакцию: 27-02-2023Дата публикации: 15-05-2023Аннотация: В данной статье рассматривается проблема накопления и систематизации информации в исследованиях, посвященных 3D-реконструкциям объектов историко-культурного наследия. При наличии большого количества разнородных источников исследователь может путаться в накопленных данных, что значительно осложняет его работу. Поскольку в исследованиях, результатами которых становятся виртуальные реконструкции, текстовые источники используются совместно с графическими, научно-технической документацией, а также физическими объектами, проходящими предварительную оцифровку, учетом и каталогизацией источников нельзя пренебрегать. Решение этой проблемы позволяет наиболее полно и оперативно использовать все имеющиеся в исследовании материалы, что, в конечном итоге, влияет на качество получаемого результата реконструкции. В данной статье на примере проекта реконструкции усадебных комплексов Подмосковья автор демонстрирует разработанную систему накопления и обогащения источниковой информации с помощью современных систем управления базами данных и инструментов программной работы с данными. Агрегированная и описанная в базе данных MySQL информация дополняется сведениями из открытых источников с помощью технологии веб-скрапинга в языке программирования Python, приобретает сквозную идентификацию и приобретает удобство использования в различных исследованиях. Стандартизованная информация позволяет быстро находить нужный источник с самого верхнего уровня, а ее обогащение дает дополнительные возможности анализа и синтеза всего агрегированного материала. Ключевые слова: Историческая информатика, Источниковедение, 3D-реконструкции, Базы данных, Подмосковные усадьбы, Python, MySQL, Веб-скрапинг, Обогащение данных, Культурное наследиеAbstract: This article deals with the problem of accumulation and systematization of information in studies devoted to 3D reconstructions of objects of historical and cultural heritage. In the presence of a large number of heterogeneous sources, the researcher may get confused in the accumulated data, which significantly complicates his work. Since in research, the results of which are virtual reconstructions, text sources are used together with graphic, scientific and technical documentation, as well as physical objects undergoing preliminary digitization, the accounting and cataloging of sources cannot be neglected. The solution to this problem allows the most complete and efficient use of all the materials available in the study, which ultimately affects the quality of the reconstruction result obtained. In this article, using the example of a project for the reconstruction of estate complexes in the Moscow region, the author demonstrates the developed system of accumulation and enrichment of source information using modern database management systems and software tools for working with data. The information aggregated and described in the MySQL database is supplemented with information from open sources using web scraping technology in the Python programming language, acquires end-to-end identification and acquires usability in various studies. Standardized information allows you to quickly find the right source from the very top level, and its enrichment provides additional opportunities for analysis and synthesis of all aggregated material. Keywords: Historical Information science, Source studies, 3D-reconstructions, Databases, Estates of Moscow region, Python, MySQL, Web-scraping, Data enrichment, Cultural heritageСовременные научные исследования все чаще осуществляются на стыке дисциплин, несколько размывая границы инструментария научной деятельности. Методы и технологии, выработанные в естественно-научных направлениях, могут использоваться в гуманитарных исследованиях, как и наоборот. Накопление знаний и формирование методов в разных областях исследования могут помочь совершенно другой области знания, а потому инструментарий исследователя сегодня расширяется за счет комплексного развития научной методологии и его частных примеров. Развитие высоких технологий позволило исторической науке использовать большие объемы информации в получении новых знаний. Понятие массового исторического источника, введенного в научный оборот И.Д. Ковальченко, позволяет охватить значительные объемы исторических документов, не изучавшихся в полной мере исследователями в предшествующие периоды. Вычислительные мощности компьютерной техники уже в 60-70-х годах прошлого века позволяли строить большие информационные системы, работа с которыми не просто сокращала затрачиваемое на подготовку к исследованиям время, но и создавала возможность проведения таких исследований, так как ранее ручная обработка десятков тысяч формуляров и карточек не приносила практической пользы. За статистическими исследованиями в исторической науке последовали работы, основанные на базах данных. Популярность подобных баз в восьмидесятых-девяностых годах прошлого века дала новый толчок изучению массовых источников, информация из которых теперь полностью заносилась в табличные базы и могла многократно использоваться в дальнейших научных изысканиях. Ряд исследовательских работ и сегодня использует базы данных для получения новых знаний, историография этого направления насчитывает множество публикаций, охватывающих разнообразные варианты исследовательского интереса[1][2]. * * * В исследованиях, посвященных 3D-реконструкциям памятников историко-культурного наследия, особую роль играет процесс сбора и структуризации данных, необходимых для проведения непосредственно реконструкций. Тем не менее, продолжение разработки выбранного направления заставляет автора работы снова погружаться в материалы большого объема, который, как правило, остается лежать «мертвым грузом» в файлах и папках. Тем не менее, наличие информационной системы, описывающей работу исследователя именно в историческом поле деятельности может значительно облегчить работу над избранной темой, а также дать дополнительные результаты, которые могут дополнить основные выводы исследования. Попытки реставрации усадебных комплексов неоднократно делались в советский период их истории, чаще всего работы ограничивались фиксацией актуального состояния усадебных комплексов, реже проводились некоторые восстановительные работы. Попытки реставрации таких комплексов чаще всего оставались в виде планов и архитектурных проектов, переход к практическому восстановлению памятников не был завершен. В постсоветское время также были предприняты попытки реставраций усадебных комплексов при активном содействии меценатов, но большинство таких попыток не имело успеха. Однако интерес к усадебной истории рос, новый импульс в развитии изучения усадебной истории дала возможность построения виртуальных реконструкций и визуализации таких реконструкций в программной среде. С 2019 года на Историческом факультете МГУ действует совместный с Центральным государственного архива Московской области[3] проект, посвященный виртуальным реконструкциям утраченных усадеб Подмосковья (в котором принимает непосредственное участие и автор данной статьи). Благодаря усилиям историков и архивистов на сегодняшний день существуют виртуальные реконструкции таких подмосковных усадеб, как Пущино-на-Наре[4], Петровское-Алабино[5], Ольгово[6], Молоди[7] и Никольское-Урюпино[8][9], а также неопубликованная реконструкция усадьбы Михайловское и ряд других работ, которые защищаются на кафедре исторической информатики МГУ им. М.В. Ломоносова. Автор изучал историю усадебных комплексов Подмосковья на материалах Общества изучения русских усадеб (ОИРУ), ведущей организации в изучении русской усадебной культуры и истории. Наиболее активно в исследовании был задействован справочник «Подмосковные усадьбы»[10], созданный некоммерческим партнерством «Русская усадьба» при участии членов Общества. Этот справочник позволил систематизировать знания об утраченных комплексах и выявить наиболее перспективные для реконструкции объекты. В процессе изучения справочника автор решил сформировать структурированную информационную систему, которая позволила бы определить наиболее интересные для реконструкций объекты, а также распределить сохранившиеся и утраченные усадьбы в географическом и хронологическом разрезе. Информация о владельцах этих усадеб также была занесена в базу данных, где таблицы были связаны между собой по идентификаторам усадебного комплекса. Также исследуемые усадьбы были привязаны к электронным копиям источников, на основании чего сформировался электронный справочник, речь о котором шла в статье «Использование технологий управления данными при создании исторических Интернет-ресурсов» автора данного исследования[11]. Ранее были описаны механизмы ручной загрузки данных в базу через интерфейс, второй этап работы над информационной системой предполагал заполнение таблиц информацией, заложенной в опубликованном справочнике, а также обогащение этой информации данными из открытых источников. Ниже подведены некоторые итоги данной работы, включая статистические обобщения по усадебным комплексам Подмосковья, а также описан процесс обогащения[12] имеющихся данных. * * * Система хранения и обработки данных была построена следующим образом: визуальный интерфейс справочника был разработан на конструкторе веб-сайтов Wordpress, сама база данных строилась в СУБД MySQL, а автоматический трансфер данных проводился с помощью инструмента Apache NiFi (все перечисленные инструменты являются бесплатными и свободно распространяются в сети Интернет). В дополнение к указанным инструментам также были использованы СУБД SQLite (файловая система баз данных, позволяющая хранить все таблицы и связи в одном физическом перемещаемом документе), а также среда разработки Jupyter Notebook, позволяющая проводить трансформации данных с помощью языка программирования Python. Изначально планировалось делить базу данных на четыре основные таблицы: усадьбы, персоналии, источники и объекты (модели). Данная концепция была несколько изменена в процессе работы: к таблице объектов была добавлена таблица реконструкций. Остальная структура осталась неизменной. В таблицу усадебных комплексов была внесена основная информация по усадьбам: идентификатор (номер усадьбы в справочнике), название, район или городской округ Московской области, век основания, четверть века, в которой усадьба была основана, год основания, идентификатор степени сохранности усадьбы (авторская экспертная оценка по шкале от 0 до 5), флаг сохранности главного дома усадьбы, а также комментарии. Данные признаки встречаются почти во всех записях справочника. Итого таблица получила 629 записей по числу зафиксированных в справочнике усадеб. Стоит чуть подробнее остановиться на классификации сохранности усадеб, которая была приведена в числе признаков. Практически по каждой записи справочника оставлены заметки о том, какие объекты сохранились и дошли до наших дней, а также их состояние. Эта информация позволила выделить шесть основных уровней классификации сохранности усадебных комплексов (таблица 1). Таблица 1. Степени сохранности усадебных комплексов (по классификации автора работы)
Эта классификация дополнилась флагом сохранности главного дома усадьбы, как системообразующего объекта. Анализ сохранности 629 комплексов привел к следующим результатам:
Далее приведем некоторую статистику по периодизации основания усадеб Подмосковья:
Также в некоторых случаях указываются причины утраты усадебного комплекса, а также примерные даты разрушения. Среди причин чаще всего появляются пожары и снос. Наиболее часто в этой связи встречаются следующие диапазоны дат: 1918-30 гг. (период постреволюционных разрушений усадеб), 1941 год (множество усадеб пострадало от немецких бомбардировок), а также 1990-2000 гг. Тем не менее, по ряду комплексов были проведены реставрационные мероприятия (в основном в 1970-1980 гг., в большинстве случаев речь идет о группах реставраторов, историков-краеведов, специалистов архитектурно-реставрационных мастерских), результатами которых стали архитектурные обмеры и проекты реставраций, содержащие чертежи актуального состояния усадьбы на момент выполнения проекта. С точки зрения географического положения наибольшее количество усадеб находится на территории Одинцовского городского округа (42), далее по убыванию идут Солнечногорский и Дмитровский округа (38 и 34 соответственно). Наименьшее число комплексов (2) находится на территориях Павлово-Посадского района, а также городских округов Орехово-Зуево и Егорьевск. Иные классификации усадебных комплексов требуют привлечения дополнительных материалов и чаще всего затруднены историческим контекстом развития этих комплексов («дворянские» и «купеческие» усадьбы пересекаются в моменте продажи имения дворянским родом в руки успевших предпринимателей и купцов, а архитектурная классификация невозможна по причине утраты большего количества комплексов в целом). Важным аспектом при рассмотрении вопроса о возможной достоверной реконструкции усадьбы является обеспеченность объекта источниковой базой. Для научной реконструкции комплекса отбираются только подкрепленные широким спектром информации, собранной в архивах, реставрационных мастерских и частных коллекциях. Имеющаяся информация по таким усадьбам, как Никольское-Урюпино и Ярополецкая усадьба Чернышевых (объекты исследований автора данной статьи, работающего над виртуальными реконструкциями этих усадеб), была добавлена к основной таблице усадебных комплексов и дополнена полученными из архивов либо открытых источников данными. Классификация по идентификатору усадьбы и архивного дела (или если его нет – по иным признакам конкретного издания) позволяет быстро найти место хранения цифровых копий источников на локальном компьютере, а также найти нужный лист архивного дела по ключевым словам. На текущий момент в таблице источников описано более 500 документов. Подобным образом были сделаны таблицы виртуальных реконструкций усадеб: в поля внесены данные о месте их хранения (как отдельные модели, так и проекты, выполненные в виртуальной среде Unreal Engine), а также даны описания, позволяющие упростить поиск по ключевым словам. Иная ситуация наблюдается с владельцами усадебных комплексов. Выявление информации о них потребовало обогащения данных информацией из открытых источников. *** В опубликованном справочнике оформлен алфавитный указатель владельцев усадеб, в котором указан номер усадьбы, ее название и фамилия и инициалы (а иногда только фамилия) владельца. Обработка этого списка вручную (более трех тысяч записей) заняла бы значительное количество времени, поэтому было принято решение воспользоваться мобильным приложением TurboScan, которое позволяет оцифровывать изображения и распознавать текст. Таким образом список владельцев был перенесен в CSV-формат (электронная таблица), но до внесения такой таблицы в базу появилась необходимость в дополнительной обработке. Основной проблемой стали записи династий владельцев, к примеру: «Яньков А.Х., Н.А. , Х.Н.». В данном случае в одной записи указаны сразу три человека. Для того, чтобы получить корректный для работы список, появилась необходимость в разбивке таких записей на несколько новых строк. В этом случае помощь работе оказала среда разработки Jupyter Notebook (интерфейс для работы с языком Python), а также ряд открытых Python-библиотек. С помощью библиотеки регулярных выражений[13],[14] была произведена обработка всего списка фамилий (рис. 1) и сформирована новая таблица владельцев усадеб, в которой список вырос с 2492 строк до 3140 (добавилось 648 имен). В новой временной таблице владельцев отдельно были вынесены фамилии владельцев для дальнейшего обогащения данных (рис. 2). Рис. 1. Фрагмент кода для обработки записей с множественными именами (снимок экрана автора работы) Рис. 2. Фрагмент обновленной таблицы владельцев. С номера 10 виден результат работы регулярных выражений (снимок экрана автора работы) Отдельный список фамилий имеет значение при обогащении информации открытыми источниками. Для текущей работы был выбран Интернет-ресурс «Родовод» (Родовод: Многоязычное генеалогическое древо [сайт] URL: https://ru.rodovid.org/wk/Многоязычное_генеалогическое_древо), который содержит наиболее удобный для обработки генеалогический ресурс. Для ручного получения информации о 3140 персоналиях необходимо огромное количество времени и сил, а потому было принято решение автоматизировать этот процесс с помощью технологии веб-скрапинга (15 топовых веб скрапинг решений 2021 года / Хабр [сайт] URL: https://habr.com/ru/post/543760), которая предполагает автоматический обход веб-страниц с целью получения информации. Информация о каждом роде на указанном информационном ресурсе доступна по ссылке «https://ru.rodovid.org/wkРод:***», где вместо звездочек указывается интересующая исследователя фамилия во множественном числе (например, Орлов – Орловы, Адлерберг – Адлерберги и т.д.). Далее на странице существует раздел представителей этой фамилии, где доступна основная информация о персоналиях (полное имя, пол, год рождения, год смерти, ссылка на статью о личности). Подобный список полезен в текущей работе при сопоставлении фамилии и инициалов с годами рождения и смерти (в справочниках они иногда указываются в информации об усадебных комплексах). Для того, чтобы получить уникальный список фамилий, все полученные в колонке «surname» записи были переведены во множественное число при помощи тех же регулярных выражений. Для этого был составлен словарь наиболее частых окончаний единственного и множественного числа (ов – овы, ев – евы, берг – берги, вич – вичи и т.д.), после чего все записи были проверены по этому словарю, получился список родов владельцев усадеб (порядка 1600 уникальных записей). Этот список был автоматически проверен в электронном справочнике Родовод (с соблюдением условий скрапинга, указанных в файле сайта «robots.txt»), а полученные данные собирались в общую таблицу. Так было получено 105000 записей о людях, принадлежащих к этим родам (рис. 3). Регулярными выражениями полные имена людей были преобразованы в фамилии с инициалами, которые далее можно сопоставлять с исходным опубликованным справочником. Рис. 3. Таблица полученных данных с ресурса "Родовод" (снимок экрана автора работы) Для тестового объединения информации были проверены первые 100 усадебных комплексов по списку. По ним было упомянуто 553 имени, среди которых 203 содержали хотя бы одну дату (рождение или смерть). По этим записям было сопоставлено 77 человек с совпадающими датами и инициалами, что составляет примерно 38% от общего числа записей, содержащих даты. Ручной разбор позволил найти еще 8 человек, которые дополнили результат до 41% найденных владельцев. При сохранении соотношения объемов наличествующей в справочнике информации, по полному списку должно найтись около 500 человек, что в условиях ограниченного объема информации следует считать хорошим рабочим результатом. На данный момент работа по поиску владельцев усадеб в открытой базе продолжается. После того, как информация о владельцах была добавлена к общему списку, удалось сформировать связи между таблицами и формат выгрузки данных в электронную среду по алгоритму, описанному ранее в статье «Использование технологий управления данными при создании исторических Интернет-ресурсов»[11]. Таким образом удалось автоматически заполнить электронный справочник без значительной ручной работы. *** Подводя итоги, хотелось бы в очередной раз подчеркнуть сложность задачи накопления и систематизации данных в изучении истории усадебных комплексов. Проблема разрозненности и бессистемного хранения информации вынуждает исследователя искать решения в современных способах структурирования и обобщения данных. Для решения обозначенной проблемы автором приведенного исследования на базе опубликованного справочника была создана программная система, в которой исследователь может искать нужные сведения об усадьбах, автоматизировать загрузку и обогащение данных, таким образом выполняя цепочку действий от первичного поиска информации до работы с источником. В рамках предложенной системы продемонстрирована работа с информационным комплексом со стороны программных решений, показан процесс его обогащения внешними источниками. Тем самым возможность аналитической работы за рамками обозначенного справочника расширена не только за счет дополнительной информации, но и благодаря программным возможностям описанных выше систем. Библиография
1. Гарскова, И. М. Историческая информатика. Эволюция междисциплинарного направления / И. М. Гарскова. – Санкт-Петербург : Издательство Алетейя, 2018. С. 210-214.
2. Юмашева, Ю. Ю. Историко-биографические исследования: методы и базы данных / Ю. Ю. Юмашева // Уральский исторический вестник. – 2015. – № 4(49). – С. 146-152. – EDN UYJSSP. 3. Бородкин Л.И., Герасимова Ю.Н. — Виртуальная реконструкция исторических усадебных комплексов: сотрудничество историков и архивистов, проектная деятельность студентов // Историческая информатика. – 2020. – № 3. – С. 103-111. DOI: 10.7256/2585-7797.2020.3.34273 URL: https://nbpublish.com/library_read_article.php?id=34273 4. Мамонова С.А. — Виртуальная реконструкция подмосковной усадьбы Пущино-на-Наре: источники, методы и технологии исследования // Историческая информатика. – 2020. – № 3. – С. 136-165. DOI: 10.7256/2585-7797.2020.3.34245 URL: https://nbpublish.com/library_read_article.php?id=34245 (дата обращения: 19.02.2023). 5. Пошевеля С.А. — Виртуальная реконструкция подмосковной усадьбы Петровское-Алабино: источники, методы и технологии исследования // Историческая информатика. – 2020. – № 3. – С. 166-184. DOI: 10.7256/2585-7797.2020.3.33979 URL: https://nbpublish.com/library_read_article.php?id=33979 (дата обращения: 19.02.2023). 6. Сорокина К.Э. — Виртуальная реконструкция подмосковной усадьбы Ольгово: источники, методы и технологии исследования // Историческая информатика. – 2020. – № 3. – С. 112-135. DOI: 10.7256/2585-7797.2020.3.34229 URL: https://nbpublish.com/library_read_article.php?id=34229 (дата обращения: 19.02.2023). 7. Кондрашева Д.И. — Виртуальная реконструкция подмосковной усадьбы Молоди: источники, методы и технологии исследования // Историческая информатика. – 2020. – № 3. – С. 185-210. DOI: 10.7256/2585-7797.2020.3.33989 URL: https://nbpublish.com/library_read_article.php?id=33989 (дата обращения: 19.02.2023). 8. Тришин И.Г. — Трехмерная реконструкция усадебного комплекса Никольское-Урюпино (Красногорский городской округ, Московская область): методы и технологии исследования // Историческая информатика. – 2020. – № 3. – С. 211-234. DOI: 10.7256/2585-7797.2020.3.33955 URL: https://nbpublish.com/library_read_article.php?id=33955 (дата обращения: 19.02.2023). 9. Маландина Т.В. — Виртуальная 3D-реконструкция интерьеров подмосковных усадеб XVIII – начала XX веков: парадные интерьеры усадебного комплекса Никольское-Урюпино // Историческая информатика. – 2021. – № 2. – С. 134-170. DOI: 10.7256/2585-7797.2021.2.36029 URL: https://nbpublish.com/library_read_article.php?id=36029 (дата обращения: 19.02.2023). 10. Подмосковные усадьбы. Каталог с картой расположения усадеб – М.: НП «Русская усадьба», 2018. – 408 с. 11. Тришин И.Г. — Использование технологий управления данными при создании исторических Интернет-ресурсов // Историческая информатика. – 2022. – № 2. – С. 18-27. DOI: 10.7256/2585-7797.2022.2.38334 EDN: JTFMFO URL: https://nbpublish.com/library_read_article.php?id=38334 (дата обращения: 19.02.2023). 12. Коваленко М.В. — Анализ методов обогащения данных // Наука без границ. 2021. №5 (57). URL: https://cyberleninka.ru/article/n/analiz-metodov-obogascheniya-dannyh (дата обращения: 19.02.2023). 13. Колмогорцев С.В., Сараев П.В. — Извлечение библиографии из текстов регулярными выражениями // Новые информационные технологии в автоматизированных системах. 2017. №20. URL: https://cyberleninka.ru/article/n/izvlechenie-bibliografii-iz-tekstov-regulyarnymi-vyrazheniyami (дата обращения: 19.02.2023) References
1. Garskova, I. M. Historical information science. Evolution of the interdisciplinary direction / I. M. Garskova. - St. Petersburg: Aleteyya Publishing House, 2018. Pp. 210-214.
2. Yumasheva, Y. Y. Historical and biographical research: methods and databases // Ural Historical Bulletin. - 2015. - No. 4 (49). - S. 146-152. – EDN UYJSSP. 3. Borodkin L.I., Gerasimova Y.N. — Virtual reconstruction of historical estate complexes: collaboration between historians and archivists, project activities of students // Historical informatics. - 2020. - No. 3. - P. 103-111. DOI: 10.7256/2585-7797.2020.3.34273 URL: https://nbpublish.com/library_read_article.php?id=34273 4. Mamonova S.A. — Virtual reconstruction of the Pushchino-on-Nara estate near Moscow: sources, methods and technologies of research // Historical informatics. - 2020. - No. 3. - P. 136-165. DOI: 10.7256/2585-7797.2020.3.34245 URL: https://nbpublish.com/library_read_article.php?id=34245 (accessed 02/19/2023). 5. Poshevelya S.A. — Virtual reconstruction of the estate near Moscow Petrovskoe-Alabino: sources, methods and technologies of research // Historical informatics. - 2020. - No. 3. - P. 166-184. DOI: 10.7256/2585-7797.2020.3.33979 URL: https://nbpublish.com/library_read_article.php?id=33979 (accessed 02/19/2023). 6. Sorokina K.E. — Virtual reconstruction of the estate near Moscow Olgovo: sources, methods and technologies of research // Historical informatics. - 2020. - No. 3. - P. 112-135. DOI: 10.7256/2585-7797.2020.3.34229 URL: https://nbpublish.com/library_read_article.php?id=34229 (accessed 02/19/2023). 7. Kondrasheva D.I. — Virtual reconstruction of the Molodi estate near Moscow: sources, methods and technologies of research // Historical informatics. - 2020. - No. 3. - P. 185-210. DOI: 10.7256/2585-7797.2020.3.33989 URL: https://nbpublish.com/library_read_article.php?id=33989 (accessed 02/19/2023). 8. Trishin I.G. — Three-dimensional reconstruction of the estate complex Nikolskoe-Uryupino (Krasnogorsk city district, Moscow region): research methods and technologies // Historical informatics. - 2020. - No. 3. - P. 211-234. DOI: 10.7256/2585-7797.2020.3.33955 URL: https://nbpublish.com/library_read_article.php?id=33955 (accessed 02/19/2023). 9. Malandina T.V. — Virtual 3D reconstruction of the interiors of estates near Moscow in the 18th – early 20th centuries: ceremonial interiors of the Nikolskoye-Uryupino estate complex // Historical informatics. - 2021. - No. 2. - P. 134-170. DOI: 10.7256/2585-7797.2021.2.36029 URL: https://nbpublish.com/library_read_article.php?id=36029 (Accessed 2/19/2023). 10. Estates near Moscow. Catalog with a map of the location of estates - M .: NP "Russian Estate", 2018. - 408 p. 11. Trishin I.G. — The use of data management technologies in the creation of historical Internet resources // Historical informatics. - 2022. - No. 2. - S. 18-27. DOI: 10.7256/2585-7797.2022.2.38334 EDN: JTFMFO URL: https://nbpublish.com/library_read_article.php?id=38334 (accessed 2/19/2023). 12. Kovalenko M.V. — Analysis of data enrichment methods // Science without borders. 2021. No. 5 (57). URL: https://cyberleninka.ru/article/n/analiz-metodov-obogascheniya-dannyh (date of access: 02/19/2023). 13. Kolmogortsev S.V., Saraev P.V. — Extracting bibliography from texts by regular expressions // New information technologies in automated systems. 2017. No. 20. URL: https://cyberleninka.ru/article/n/izvlechenie-bibliografii-iz-tekstov-regulyarnymi-vyrazheniyami (Date of access: 02/19/2023)
Результаты процедуры рецензирования статьи
В связи с политикой двойного слепого рецензирования личность рецензента не раскрывается.
Рецензируемая статья затрагивает актуальную проблему создания баз данных, ориентированных на систематизацию и дальнейшее изучение информации о дворянских усадьбах Подмосковья, количество которых исчисляется сотнями. Степень сохранности этих объектов культурного наследия различается очень существенно: от утраченных полностью или частично до сохранившихся практически в аутентичном виде. Формирование подобных баз данных позволяет обоснованно выбрать усадьбы, которые представляют интерес для разработки их 3d моделей в целях создания достоверных виртуальных реконструкций на основе представительного комплекса источников. В статье дается краткое описание опыта совместных проектов Центрального государственного архива Московской области и исторического факультета МГУ в данной области исследований. Автор статьи делает следующий шаг в развитии таких проектов. В основу предлагаемой им базы данных положена информация из справочника «Подмосковные усадьбы», опубликованного недавно при участии Общества изучения русских усадеб (ОИРУ). Автором предложен визуальный интерфейс для работы с информацией справочника на основе конструктора веб-сайтов WordPress с использованием СУБД MySQL. Автор пользуется средой разработки Jupiter Notebook, позволяющей проводить трансформацию данных с помощью языка программирования Pyton. База данных содержит 4 основные таблицы: Усадьбы, Информация о владельцах, Источники и Объекты (модели и реконструкции). Представляет интерес авторская экспертная оценка степени сохранности главного дома каждой усадьбы: от полной сохранности (оценка 5) до полной утраты (оценка 0). Исходя из предложенных критериев сохранности, автор получил обоснованную оценку численности каждой группы: из общего числа 629 учтенных усадеб в отличном состоянии сегодня находятся около 8%, в хорошем состоянии – 11%, в удовлетворительном или неудовлетворительном – 63,5%. В 26% случаев главный дом усадьбы в том или ином виде сохранился. Существенно, что по информации, представленной в базе данных, наибольшее число усадеб было создано во второй половине XVIII века, в то время, как самые ранние даты относятся к началу XVI века. База данных позволяет также выявить причины утраты усадебных комплексов и примерные даты, а также географическое положение усадеб на территории Московской области. С точки зрения возможности построения достоверной реконструкции усадеб важнейшей информацией является источниковая база по истории и архитектуре каждого усадебного комплекса. На текущий момент в соответствующей таблице базы данных описано более 500 документов. Выявление информации о владельцах усадеб потребовало обогащения имеющихся архивных данных информацией из открытых источников. Важной компонентой авторской методики является работа с данными о династиях владельцев, которая обеспечивается программой на языке Pyton, в результате чего автор сформировал расширенную таблицу владельцев усадеб, включающую 3140 человек. Информацию об этих персоналиях автор собирает с помощью технологий веб-скрапинга. В целом, исследование, проведенное автором статьи, является существенным вкладом не только в дальнейшее изучение истории русских усадеб и их виртуальной реконструкции, но и в использование генеалогических интернет-ресурсов для обогащения исходного источникового комплекса на основе предложенных автором оригинальных программных решений. Статья написана в хорошем академическом стиле, актуальность и научная новизна работы не вызывают сомнений. Методика исследования и полученные автором результаты, безусловно, вызовут интерес читательской аудитории. Статья может быть рекомендована к печати в журнале «Исторический журнал: научные исследования». |