Первый шаг к оцифровке архивных материалов по истории России

Первый шаг к оцифровке архивных материалов по истории России

Программы машинного чтения — это перспективный инструмент для изучения российских исторических документов. Об этом заявил член-корр РАН Алексей Сиренов на заседании президиума РАН, посвященного эпохе Петра I.

По словам, ученого, до недавнего времени в исторической науке почерк Петра I считался очень сложным для чтения,  — известно, что создатель Российской Империи писал неразборчиво, это создавало серьезные трудности в изучении документов, вышедших из-под его пера.

Чтобы решить эту проблему, ПАО Сбербанк разработал специальную программу,  — Digital Пётр, в основу которой легла технология искусственного интеллекта. Специалисты Санкт-Петербургского института истории РАН предоставили для анализа 681 страницу документов, созданных Петром Великим. Результат оказался впечатляющим: удалось правильно прочитать 97% текста. При этом время распознавания составляет 35 страниц в минуту, тогда как у историков на расшифровку каждой страницы столь сложного почерка уходит по несколько часов.

По мнению А. Сиренова, использование программы открывает новую эпоху в изучении русских исторических документов XVII – XIX вв. С ее помощью можно будет искать нужную информацию в массиве документов. В перспективе ее собираются научить определению подлинности того или иного документа, а также его автора. Кроме того, планируется ее адаптация к другим типам почерков.

Источник: СБЕР

Короткая ссылка на эту статью: https://cleverrussia.ru/4mpmZ

Редакция журнала Умная Россия. Мы ищем материалы, которые будут для вас полезны. Если у вас есть предложения, просим высылать их на почту: news@cleverrussia.ru

Наверх