Google разработала нейросеть, которая восстанавливает утраченные фрагменты латинских надписей

0
4

Google разработала нейросеть, которая восстанавливает утраченные фрагменты латинских надписей

Пример латинского письма. Из-за дефицита площади, между словами часто не делали промежутков. Источник: Getty Images

Google DeepMind разработала открытую нейросеть Эней (Aeneas), которая помогает восстанавливать и древние поврежденные латинские надписи. Древние римляне оставили много письменных памятников, однако не все они сохранились в идеальном состоянии. Многие из них повреждены, большая часть дошла до нас лишь в виде фрагментов. Aeneas помогает восстановить утраченные части текста.

Google разработала нейросеть, которая восстанавливает утраченные фрагменты латинских надписей

Восстановленный бронзовый военный диплом из Сардинии, выданный императором Траяном матросу на военном корабле. Иллюстрация: predictingthepast.com/aeneas

Оставьте свой скептицизм

Да, нейросети могут ошибаться и придумывать то, чего нет. Но Google подошла к задаче с научным подходом — для восстановления текста нейросети нужен контекст. Зная период, к которому относится находка, и место ее обнаружения, нейросеть анализирует словарный запас, который встречается на найденных памятниках той эпохи, а также события, актуальные для того времени, чтобы угадать утраченные слова максимально точно. Дает ли это гарантию, что Aeneas воспроизведет оригинальную надпись безошибочно? Конечно нет, это невозможно. Но он сделает действительно неплохую работу, основанную на научном подходе и мощных возможностях современных технологий. Особенно сложная эта задача для памятников, где неизвестна даже длина утраченного фрагмента. Так что да, это не дает 100% гарантии в правдивости. Но для памятников, которые повреждены безвозвратно, лучшего результата мы достичь уже не сможем. По крайней мере, до изобретения машины времени.

Технические детали Aeneas

  • Модель воспринимает как текст, так и изображения
  • Обучена на ~176 000 латинских надписях в общей сложности 16 млн символов
  • Названа в честь мифического героя из Троянского эпоса
  • Создана совместно DeepMind с исследователями из университетов Ноттингем, Уорвик, Оксфорд и Афин
  • Атрибуция: определяет, где (зависит от одной из 62 провинций) и когда (точность до ~13 лет) была создана надпись
  • Эффективность: при повреждениях до 10% символов правильный вариант в 73 % случаев; даже без знания длины — в 58 %
  • Поиск аналогов: находит параллели по стилю, форме, контексту

Интерактивная версия Aeneas доступна на predictingthepast.com, а код и база данных — открыты для исследователей.

Почему это важно

Нейросети очень хорошо находят закономерности в больших массивах информации, в которых человеку очень трудно определить взаимосвязи. Поэтому такой подход поможет восстановить немного больше исторической информации. Даже ошибившись в конкретных словах, Aeneas может подсказать основной посыл текста.

Источник: www.engadget.com

НОВОСТИ ПАРТНЕРОВ

БОЛЬШЕ НОВОСТЕЙ