Большие данные без большого шума

Александр Гурьянов

Анализ больших данных — это крупная компьютерная отрасль. Обычно речь идет о маркетинговых исследованиях, результаты которых должны помогать продавать больше товаров. Если разобраться, то наука всегда оперирует большими данными. Экспериментальные данные, которых, как правило, много, содержат артефакты и искажены шумом. Задача ученого выделить в них закономерности и выразить их в компактном виде, желательно на четком математическом языке. На это способен только человеческий интеллект.

Но и искусственный интеллект кое-что умеет. Компьютерные сети могут понизить неопределенность исходных данных эксперимента и представить их в удобном для анализа виде. Один из способов такого применения обучаемых нейронных сетей только что продемонстрировали физики Берлинского центра материалов и энергии имени Гельмгольца под руководством доктора Грегора Хартманна (Gregor Hartmann), заведующего лабораторией методов ИИ. С его помощью они измерили параметры излучения лазера на свободных электронах. Статья появилась в конце прошлого года в журнале Scientific Reports.

Ученые разработали программу, которая сжимала набор данных, а затем удаляла из них шум. Это стало возможным благодаря тому, что их сеть представляет собой комбинацию двух сетей, первая сжимает данные, вторая — восстанавливает. Обе их тренируют так, чтобы сжатые данные было удобно интерпретировать исследователю. В 2017 году, когда такие сети предложил Гугл, их широкое практическое применение не просматривалось.

Лазер на свободных электронах позволяет получать очень короткий импульс излучения, длящийся от фемто- до аттосекунд. Для его измерения обычно применяют газовые детекторы. В них импульс выбивает фотоэлектроны, характеристики которых затем анализируют приборы. Излучение лазера сильно меняется от импульса к импульсу, но экспериментаторам нужно точно знать параметры каждого из них.

Новая нейросеть как раз и решает эту задачу. Она успешно определяет энергию и интенсивность лазерного импульса по импульсу фотоэлектронов детектора излучения. ИИ извлекает ценную информацию из зашумленных данных о времени пролета фотоэлектронов и даже учитывает индивидуальные характеристики конкретного детектора. Программа делает это гораздо лучше других способов. Интересно, что она позволяет реконструировать сигналы, которые незаметны на фоне шума в первичных данных.

Доктор Хартманн говорит, что его ИИ сможет выявлять неожиданные физические эффекты и корреляции в больших наборах самых разных экспериментальных данных. Годы работы позволили немецким ученым создать очень удобную для пользователя программу. Ее мощный инструментарий годится не только для оптики и спектроскопии.


Scientific Reports, 2022; 12 (1)

Разные разности
Камни боли
Недавно в МГУ разработали оптическую методику, позволяющую определить состав камней в живой почке пациента. Это важно для литотрипсии — процедуры, при которой камни дробятся с помощью лазерного инфракрасного излучения непосредственно в почках.
Женщина изобретающая
Пишут, что за последние 200 лет только 1,5% изобретений сделали женщины. Не удивительно. До конца XIX века во многих странах женщины вообще не имели права подавать заявки на патенты, поэтому частенько оформляли их на мужей. Сегодня сит...
Мужчина читающий
Откуда в голове изобретателя, ученого вдруг возникает идея, порой безумная — какое-нибудь невероятное устройство или процесс, которым нет аналогов в природе? Именно книги формируют воображение юных читателей, подбрасывают идеи, из которых выраст...
Пишут, что...
…археологи обнаружили на стоянке мамонтов Ла-Прель в округе Конверс бусину, сделанную из кости зайца, возраст которой составляет около 12 940 лет… …астрофизики впервые обнаружили молекулы воды на поверхности астероидов Ирис и Массалия… ...