Расшифровка метрических книг: нейросеть позволит быстро найти информацию о далеких предках

26.01.2023, 11:15

Видеосюжет: Нахид Бабаев
Видео программы «Сегодня»

Нейросети восстанавливают связь поколений. Россиянам, чтобы отыскать родственника, например, из VIII века, больше не нужно тратить месяцы или даже годы. Запросы, поиски и перелистывание огромных томов уходят в прошлое. Компания «Яндекс» научила искусственный интеллект расшифровывать рукописные тексты метрических книг. Дореволюционные записи с ятями иногда трудно понять даже эрудированному человеку. Компьютеру хватит пары секунд. Говорят, даже знаменитый врачебный почерк — не проблема.

Москвичка Ирина Владимировна уже несколько лет изучает историю своей семьи. Поначалу это нужно было для документов, а потом, что называется, втянулась.

Ирина Карлина, жительница Москвы: «Мне это интересно, как учились, где были, как жили, как работали предки».

Если про дедушек и бабушек Ирина и так все знала, то вот дальше, вернее, старше нужно было обращаться в архивы, причем разные.

Ирина Карлина: «13 загсов и 15 паспортных столов я прошла вот таким вот квестом. Потратила 2,5 года».

Всю информацию о предках-москвичах, живших до 1917 года, можно найти в главном архиве Москвы. На его стеллажах метрические книги, исповедные ведомости и ревизские сказки с результатами переписи населения. По сути, здесь информация если не обо всех, то о большинстве жителях Москвы и Московской губернии с середины XVIII и до начала XX веков. Записи вполне подробные.

Марьям Кустова, главный хранитель фондов и заместитель директора Главархива Москвы: «Метрическая книга московской церкви Иоанна Воина на Большой Якиманке. Она существует до сих пор, большая красивая церковь. 1914 год, актовая запись №47. Евгений, в честь мученика Евгения, день которого 7 ноября. Родители: живущие в доме Данилина крестьянин Московской губернии Серпуховского уезда Васильевской волости деревни Петрухино Василий Васильев Смоленский».

Раньше для получения информации нужно было писать запросы, самому идти в архив и искать. Два года назад правительство Москвы запустило проект «Моя семья». Все документы постепенно переводят в электронный формат, доступ к ним может получить каждый.

Больше половины метрических книг оцифрованы. Это получается почти 8,5 миллиона страниц. А если учесть, что на каждом развороте по 3–4 имени, получается, что в цифровом виде доступны данные 20 миллионов человек.

Но основная проблема все же оставалась. Искать можно было, лежа дома на диване, но весь процесс мог занять годы. Теперь на это уйдут считаные минуты. «Яндекс» научили нейросети расшифровывать рукописные тексты. Благодаря этому в базе сервиса «Поиск по архивам» можно быстро находить документы с упоминанием фамилии, населенного пункта или любых других слов. Алгоритм построен на основе системы оптического распознавания символов.

Елена Бубнова, руководитель поиска «Яндекса»: «Чтобы понять разный почерк, разный стиль письма, мы специальным образом брали разные документы, подсвечивали, чтобы был разный цвет фона, чтобы по-разному были буквы написаны, более разнообразный изначальный исходный материал, чтобы алгоритм обучился максимально хорошо распознавать все многообразие».

Даже те фрагменты текста, на чтение которых человек потратит полчаса, у сервиса уйдут секунды.

Елена Бубнова: «Давайте, например, Фёдора Достоевского поищем. Видим, что у нас мгновенно результат появился. Его можно нажать и увидеть, как это выглядит в оригинале, то есть по факту картинку. На ней очень сложно что-то разобрать, поэтому сразу справа показываем расшифровку. Расшифровка сейчас идет в дореформенной лексике, орфографии. В будущем сможем упростить, осовременить».

Сейчас в базе сервиса представлены документы из архивов Москвы, Оренбургской и Новгородской областей.

Елена Бубнова: «Архивная база, несомненно, мы надеемся, будет расширяться, более того, технологию можно будет использовать не только для архивов, а для распознавания рукописных текстов».

Благодаря архивным поискам Ирина Владимировна узнала, что ее предки веками жили в Клину Московской губернии, ее прапрапрапрадед работал ямщиком, среди предков есть пожарные, участники нескольких войн. И так она знает каждого члена своей семьи плоть до середины XVIII века.

Читайте также