• A
  • A
  • A
  • АБВ
  • АБВ
  • АБВ
  • А
  • А
  • А
  • А
  • А
Обычная версия сайта

Автографы Петра Великого: Чтение технологиями искусственного интеллекта

В сентябре 2020 года стажеры-исследователи Центра истории России Нового времени под руководством И.И. Федюкина приняли участие в проекте, реализуемом совместно Сбербанком и Санкт-Петербургским институтом истории РАН. Целью проекта, приуроченного к отмечаемому в 2022 году 350-летию со дня рождения монарха, было «обучение» искусственного интеллекта чтению рукописей Петра I.

Каждый историк, когда-нибудь имевший с ними дело, знает, как непросто бывает разобрать почерк этого государя. Поэтому проект представляет огромную практическую важность для исследователей петровской эпохи. Если говорить непосредственно о рабочем процессе, то главной задачей стажеров-исследователей Центра было как можно точнее разметить отдельные строки в предоставленных им электронных снимках рукописей Петра, которые уже были прочитаны и транскрибированы специалистами. Это необходимо, чтобы алгоритм научился устанавливать соответствие между текстом и разными вариантами его графического изображения, то есть «читать» рукописи.

Студенты и аспиранты ВШЭ обрабатывали различные документы: от официальных писем и инструкций Петра I до его личной переписки с 1709 по 1713 годы. Оригиналы документов, написанные скорописью XVIII века, хранятся в настоящее время в Санкт-Петербургском институте истории РАН и Российском государственном архиве древних актов. В конечном итоге было обработано свыше 6000 рукописных строк. Digital humanities – внедрение цифровых технологий в сфере гуманитарных наук – бурно развиваются сегодня во всем мире. Данная работа позволила стажерам Центра познакомиться с актуальными направлениями digital humanities и внести свой вклад в их развитие.

На сегодняшний день существует несколько зарубежных программ для чтения архивных документов, наиболее популярная из которых Transcribus. Однако эти программы предназначены в первую очередь для латиницы и не вполне справляются с расшифровкой кириллического письма. Проект Сбербанка и СПбИИ РАН направлен на создание аналогичного инструмента для чтения исторических документов именно на русском языке прошлых эпох. На сегодняшний день уже имеются первые результаты проекта, отраженные в совместной статье сотрудников СПбИИ РАН и Сбербанка.

Результаты проекта были представлены осенью 2020 года на международном онлайн-соревновании по программированию, где проект занял 2-е место, а идея расшифровки старинных рукописей с помощью искусственного интеллекта заинтересовала представителей IT-индустрии со всего мира.

В проекте принимали участие стажеры-исследователи: М. Д. Аксенова, А. О. Видничук, А. Д. Новикова, М. И. Парфеня, М. С. Петрова.

 

Участники проекта

Федюкин Игорь Игоревич

Центр истории России Нового времени: Директор

Парфеня Мария Игоревна

Центр истории России Нового времени: Стажер-исследователь

Видничук Анастасия Олеговна

Центр истории России Нового времени: Стажер-исследователь

Аксенова Мария Дмитриевна

Центр истории России Нового времени: Стажер-исследователь

Новикова Арина Дмитриевна

Центр истории России Нового времени: Стажер-исследователь

Петрова Мария Святославовна

Центр истории России Нового времени: Стажер-исследователь


 

Нашли опечатку?
Выделите её, нажмите Ctrl+Enter и отправьте нам уведомление. Спасибо за участие!
Сервис предназначен только для отправки сообщений об орфографических и пунктуационных ошибках.