ИИ заполняет пробелы

Александр Гурьянов
(«ХиЖ», 2022, №4)

Известная компания DeepMind, принадлежащая корпорации Google и разрабатывающая приложения ИИ к различным областям жизни, на этот раз взялась за тексты. Ее ученые совместно с историками из университетов Греции, Англии и Италии создали нейронную сеть, способную анализировать большие объемы неполных текстов. Программу для разбора древнегреческих записей назвали «Итакой» по имени родного острова Одиссея, главного героя одноименного греческого эпоса; ее обучили на примере ста восьмидесяти тысячах сканов греческих текстов, в том числе отрывочных, из базы данных Гуманитарного института Паккарда в Лос-Алтосе, Калифорния. «Итаку» разработали девять ученых под руководством Яниса Ассаеля (Yannis Assael) и Теи Зоммерсшильд (Thea Sommerschield).

Результаты применения программы помогут историкам восстановить историческую справедливость. Она выдает вероятные способы заполнения пробелов древнегреческих тестов, наносит на географическую карту из восьмидесяти четырех регионов вероятности происхождения текста в каждом из них, а также строит временное распределение вероятности его создания с разбросом в несколько десятков лет. «Итака» восстанавливает поврежденные тексты с вероятностью 62% и с точностью 71% определяет места их происхождения. Проверка показала: если группа экспертов-историков правильно восстанавливает запись в 25% случаев, то совместно с программой они делают это в 72% случаев. То есть одной «Итаки» недостаточно для однозначного и окончательного воссоздания текста: последнее слово все равно останется за интеллектом исследователя.

Сейчас ученые адаптируют программу к другим древним текстам, к примеру написанным на иврите или языке индейцев майя. Код «Итаки» открыт, она доступна в Сети, запрета на ее модификацию нет. Поэтому программа сможет стать хорошим подспорьем для историков. И не только. Проницательный читатель заметит, что принципиально ничто не мешает использовать подобную разработку для восстановления, дешифровки и атрибуции любых текстов любых времен. Здесь открывается широчайшее поле деятельности для материнской транснациональной корпорации, которая обладает всеми исходными данными для активности такого рода.


(Nature, 9 марта 2022 года - полный текст)

123

Разные разности

09.08.2022 17:00:00

…температура в Арктике растет в четыре раза быстрее, чем глобальное потепление

…около половины оплодотворенных яйцеклеток погибает очень рано, еще до того, как мать узнает, что она беременна

…если вы хотите найти безопасный район для проживания, выберите тот, где жители доверяют друг другу и выгуливают много собак…


>>
05.08.2022 17:00:00

Многие самки пауков съедают своих партнеров после спаривания, и большинство самцов относятся к этому покорно. Но есть пауки, которых такое положение вещей не устраивает. И они стараются удрать в самый последний момент.

>>
03.08.2022 17:00:00

Израильские ученые уверены, что взаимная симпатия с потенциальным партнером зависит от того, насколько хорошо они могут синхронизировать свои тела.

>>
01.08.2022 17:00:00

Ученые из Университета Ньюкасла обнаружили новые типы бактерий, которые прилипают к плавающим в морской толще частицам микропластика и путешествуют на них по океану.

>>
26.07.2022 16:00:00

Почти в половине проб воды, взятых из рек по всему миру, присутствуют биологически активные компоненты лекарств в концентрациях, от которых можно ожидать экотоксикологических эффектов.

>>