Большие данные без большого шума

Александр Гурьянов
(«ХиЖ», 2023, №2)

Анализ больших данных — это крупная компьютерная отрасль. Обычно речь идет о маркетинговых исследованиях, результаты которых должны помогать продавать больше товаров. Если разобраться, то наука всегда оперирует большими данными. Экспериментальные данные, которых, как правило, много, содержат артефакты и искажены шумом. Задача ученого выделить в них закономерности и выразить их в компактном виде, желательно на четком математическом языке. На это способен только человеческий интеллект.

Но и искусственный интеллект кое-что умеет. Компьютерные сети могут понизить неопределенность исходных данных эксперимента и представить их в удобном для анализа виде. Один из способов такого применения обучаемых нейронных сетей только что продемонстрировали физики Берлинского центра материалов и энергии имени Гельмгольца под руководством доктора Грегора Хартманна (Gregor Hartmann), заведующего лабораторией методов ИИ. С его помощью они измерили параметры излучения лазера на свободных электронах. Статья появилась в конце прошлого года в журнале Scientific Reports.

Ученые разработали программу, которая сжимала набор данных, а затем удаляла из них шум. Это стало возможным благодаря тому, что их сеть представляет собой комбинацию двух сетей, первая сжимает данные, вторая — восстанавливает. Обе их тренируют так, чтобы сжатые данные было удобно интерпретировать исследователю. В 2017 году, когда такие сети предложил Гугл, их широкое практическое применение не просматривалось.

Лазер на свободных электронах позволяет получать очень короткий импульс излучения, длящийся от фемто- до аттосекунд. Для его измерения обычно применяют газовые детекторы. В них импульс выбивает фотоэлектроны, характеристики которых затем анализируют приборы. Излучение лазера сильно меняется от импульса к импульсу, но экспериментаторам нужно точно знать параметры каждого из них.

Новая нейросеть как раз и решает эту задачу. Она успешно определяет энергию и интенсивность лазерного импульса по импульсу фотоэлектронов детектора излучения. ИИ извлекает ценную информацию из зашумленных данных о времени пролета фотоэлектронов и даже учитывает индивидуальные характеристики конкретного детектора. Программа делает это гораздо лучше других способов. Интересно, что она позволяет реконструировать сигналы, которые незаметны на фоне шума в первичных данных.

Доктор Хартманн говорит, что его ИИ сможет выявлять неожиданные физические эффекты и корреляции в больших наборах самых разных экспериментальных данных. Годы работы позволили немецким ученым создать очень удобную для пользователя программу. Ее мощный инструментарий годится не только для оптики и спектроскопии.


Scientific Reports, 2022; 12 (1)

Разные разности
Солнечные батареи отбрасывают тень
Исследователи из Корнельского университета детально исследовали, как изменяется жизнь водоема, на поверхности которого лежат солнечные панели.
Песни китов похожи на человеческую речь
Какой язык более эффективен? Тот, в котором слова короче. Во-первых, на их произношение человек тратит меньше энергии и меньше времени. А во-вторых, короткие слова легче воспринимать. Как выяснилось, и горбатым китам не чужда эта премудрость.
Ивановские нанотехнологии работают!
Химики всегда занимались нанотехнологиями, потому что постоянно манипулировали молекулами и атомами, молекулярными кластерами и комплексами (а это все нанообъекты). Всегда занимались нанотехнологиями и в Ивановском химико-технологическом университете...
Умные российские стекла
Под американские санкции неожиданно попала никому не известная в России маленькая наукоемкая компания «Октогласс». Ее основали в 2017 году молодые специалисты и предприниматели, выпускники МИФИ, СамГТУ и МИРЭА. Чем же наши молодые разр...