Торвальдсен Г. —
Связывание записей в историческом регистре населения Норвегии
// Историческая информатика. – 2019. – № 2.
– С. 212 - 231.
DOI: 10.7256/2585-7797.2019.2.30126
URL: https://e-notabene.ru/istinf/article_30126.html
Читать статью
Аннотация: Исторический регистр населения Норвегии содержит данные о населении страны с 1800 до 1964 г. Сведения о населении страны с 1964 г. до современности собраны в Центральном регистре населения. Исторический регистр состоит из данных метрических книг и записей актов гражданского состояния, заполняющих пробелы между переписями населения, проводившимися каждые десть лет. В 1801 г. и, начиная с 1865 г., эти переписи являлись номинативными, то есть содержали имена людей. Настоящая статья посвящена проблемам связывания записей переписей и метрических книг (record linkage) в период с 1800 по 1920 г. Особое внимание уделяется идентификации индивидов и трудностям связывания записей. Главная проблема заключается в том, чтобы идентифицировать человека по записям, относящимся к разным годам, в условиях значительного количества однофамильцев и вариации фиксации их имен, а также возраста. Создание стабильных идентификаторов индивидов и процедура связывания записей из различных источников потребовали разработки нового программного обеспечения, объединяющего автоматические и ручные методы. С помощью рассмотренных методов удалось связать сведения о более чем миллионе человек из нескольких источников.Анализ локальных баз данных позволяет надеяться на успешное связывание от 2/3 до 90% записей по различным периодам и регионам страны. Исторический регистр Норвегии является уникальным по охвату территории и многообразию связанных в нем исторических источников.
Abstract: The historical population register of Norway contains data on the country's population from 1800 to 1964. Information on the country's population from 1964 to the present is collected in the Central Population Register. The historical register consists of these metric books and civil records, filling in the gaps between population censuses conducted every ten years. In 1801 and, beginning in 1865, these censuses were nominative, that is, contained the names of people. This article is devoted to the problems of linking census records and metric books (record linkage) from 1800 to 1920. Special attention is paid to the identification of individuals and the difficulties of linking records. The main problem is to identify a person by the records belonging to different years, in terms of a significant number of namesakes and variations in the fixation of their names, as well as age. The creation of stable identifiers for individuals and the procedure for linking records from various sources required the development of new software combining automatic and manual methods. Analysis of local databases allows us to hope for successful linking from 2/3 to 90% of records for various periods and regions of the country. The historical register of Norway is unique in its coverage of the territory and the variety of historical sources related to it.