Мозг и франкенштейны

Александр Гурьянов
(«ХиЖ», 2022, №10)

Проблема компьютерного распознавания образов существует многие десятилетия. На этом пути достигнут огромный прогресс. Человечество создало разнообразные системы ИИ, но задача далека от окончательного решения. Причина в отсутствии хотя бы качественной теории мозга, а значит, и понимании того, как распознавание происходит в человеческой голове. Однако кое-что ясно уже сейчас. При идентификации объекта на изображениях люди опираются на взаимное расположение различных его частей, то есть всегда оценивают форму объекта в целом.

Нейронные сети сегодня доминируют среди математических моделей явлений, происходящих в визуальных отделах коры головного мозга. Но обладают ли сети чувствительностью к форме? На этот вопрос в своем новом исследовании постарались ответить двое профессоров, канадец Джейс Илдер (James Elder) из Йоркского университета и американец Николас Бейкер (Nicholas Baker) из колледжа Лойолы в Чикаго. Картинки силуэтов животных, предъявляемые ИИ и людям для опознания, они разрезали на две части, которые затем неправильно соединяли. Силуэт предмета оказывался искаженным, но детали каждой части сохранялись. Получившиеся объекты исследователи называли франкенштейнами по имени главного героя известного романа Мэри Шелли.

Человека франкенштейны вводили в заблуждение, тренированные же сети не были чувствительны к их конфигурации. Общая форма объекта для сетей оказалась не важна. И смена методов тренировки сети, и изменение ее архитектуры не вели к устанению этого различия. Ни одна из самых сложных сетей так и не сумела полностью воспроизвести последовательность человеческих ответов при распознавании предметов.

Авторы делают вывод о принципиальных отличиях в восприятии образов сетями и мозгом. Это означает, что сеть имеет неустранимые недостатки, заложенные в принципах ее организации. Поэтому, говорит профессор Илдер, нейросети могут быть опасны в реальных приложениях, особенно в индустриальных и военных применениях. Один из негативных примеров — это системы управления трафиком на дорогах. Объекты здесь загораживают друг друга, поэтому человек опознает их, домысливая невидимые фрагменты. ИИ же может только воспринимать фрагменты, но не способен их домыслить. Поэтому его оценка рисков может не соответствовать реальности дорожного движения.

Профессора надеются, что для достижения адекватности сетей их нужно тренировать на более широком наборе объективных задач, не ограничиваясь при этом категорией распознавания образов. Вывод, на наш взгляд, сколь неоднозначный, столь и сомнительный.


iScience, 25, 9, 104913, 2022

Разные разности
Песни китов похожи на человеческую речь
Какой язык более эффективен? Тот, в котором слова короче. Во-первых, на их произношение человек тратит меньше энергии и меньше времени. А во-вторых, короткие слова легче воспринимать. Как выяснилось, и горбатым китам не чужда эта премудрость.
Ивановские нанотехнологии работают!
Химики всегда занимались нанотехнологиями, потому что постоянно манипулировали молекулами и атомами, молекулярными кластерами и комплексами (а это все нанообъекты). Всегда занимались нанотехнологиями и в Ивановском химико-технологическом университете...
Умные российские стекла
Под американские санкции неожиданно попала никому не известная в России маленькая наукоемкая компания «Октогласс». Ее основали в 2017 году молодые специалисты и предприниматели, выпускники МИФИ, СамГТУ и МИРЭА. Чем же наши молодые разр...
Ледники тают все быстрее и быстрее
Исследовательская группа из Цюрихского университета подготовила обширный обзор потерь массы ледников в мире. Ученые собрали данные региональных изменений массы ледников с 2000 по 2023 год. За период наблюдений масса ледников во всем ми...