ИИ заполняет пробелы

Александр Гурьянов
(«ХиЖ», 2022, №4)

Известная компания DeepMind, принадлежащая корпорации Google и разрабатывающая приложения ИИ к различным областям жизни, на этот раз взялась за тексты. Ее ученые совместно с историками из университетов Греции, Англии и Италии создали нейронную сеть, способную анализировать большие объемы неполных текстов. Программу для разбора древнегреческих записей назвали «Итакой» по имени родного острова Одиссея, главного героя одноименного греческого эпоса; ее обучили на примере ста восьмидесяти тысячах сканов греческих текстов, в том числе отрывочных, из базы данных Гуманитарного института Паккарда в Лос-Алтосе, Калифорния. «Итаку» разработали девять ученых под руководством Яниса Ассаеля (Yannis Assael) и Теи Зоммерсшильд (Thea Sommerschield).

Результаты применения программы помогут историкам восстановить историческую справедливость. Она выдает вероятные способы заполнения пробелов древнегреческих тестов, наносит на географическую карту из восьмидесяти четырех регионов вероятности происхождения текста в каждом из них, а также строит временное распределение вероятности его создания с разбросом в несколько десятков лет. «Итака» восстанавливает поврежденные тексты с вероятностью 62% и с точностью 71% определяет места их происхождения. Проверка показала: если группа экспертов-историков правильно восстанавливает запись в 25% случаев, то совместно с программой они делают это в 72% случаев. То есть одной «Итаки» недостаточно для однозначного и окончательного воссоздания текста: последнее слово все равно останется за интеллектом исследователя.

Сейчас ученые адаптируют программу к другим древним текстам, к примеру написанным на иврите или языке индейцев майя. Код «Итаки» открыт, она доступна в Сети, запрета на ее модификацию нет. Поэтому программа сможет стать хорошим подспорьем для историков. И не только. Проницательный читатель заметит, что принципиально ничто не мешает использовать подобную разработку для восстановления, дешифровки и атрибуции любых текстов любых времен. Здесь открывается широчайшее поле деятельности для материнской транснациональной корпорации, которая обладает всеми исходными данными для активности такого рода.


(Nature, 9 марта 2022 года - полный текст)

Разные разности
29.09.2023
Двадцать пять кг кожной пыли
Каждую минуту взрослый человек теряет около 50 000 чешуек кожи. Так что наша верхняя кожа ...
27.09.2023
Подведены итоги Всероссийского научного конкурса «Наука будущего»
В Орле завершили работу VIII Всероссийский молодежный научный форум «Наука будущего — наук...
25.09.2023
Как города борются с жарой
Можно ли бороться с жарой? Наука уверенно отвечает на этот вопрос — да. Давайте посмотрим, как ...
22.09.2023
Памятник мухе
Самое массовое лабораторное животное, на котором поставлены миллионы экспериментов, это плодовая муш...