2024 год был непростым с точки зрения политических и социальных процессов, но и в нем осталось место для научных достижений. Боевые действия, природные катаклизмы, экологические катастрофы ставили перед людьми всё новые вопросы. При этом никуда не делось и решение повседневных проблем, связанных с инвалидностью, разработкой новых материалов, развитием искусственного интеллекта. «Фонтанка» попросила петербургских ученых назвать самые яркие научные события года.
Физика: Шаг к созданию ядерных часов, изучение галактик
Ведущий научный сотрудник Нового физтеха ИТМО, кандидат физико-математических наук Дмитрий Глазов рассказал «Фонтанке» о ключевых открытиях 2024 года в области атомной физики и астрофизики.
Ученым впервые удалось измерить энергию изомерного состояния ядра тория-229. Это шаг к созданию часов небывалой точности — на основе ядерного перехода.
«Мы привыкли к тому, что самые точные часы в мире — это атомные часы. Они построены на переходах между состояниями электронов в атоме. А если построить часы на ядерном переходе, то они будут ещё на порядок точнее, так как ядро менее чувствительно к внешним воздействиям. Это позволит с гораздо большей точностью всё определять не только время, но и расстояние и другие величины. С помощью таких часов физики даже хотят попробовать обнаружить тёмную материю. Для того чтобы построить атомные или ядерные часы, нужно иметь возможность с помощью лазера возбуждать такой переход. Обычно ядерные возбуждения лежат в другой области спектра. Так что переход нужен совершенно уникальный, он есть только в единственном ядре, в изотопе торий-229», — рассказывает Дмитрий Глазов.
О такой особенности тория ученые знали давно, но добиться нужного результата смогла международная группа исследователей в Физико-техническом институте Брауншвейга только в этом году.
Применение сверхточных часов влияет на жизнь людей, даже если они этого не замечают. Например, атомные часы используют в системе GPS. Ядерные будут актуальны в том числе для подобных целей.
Атомные часы сейчас выглядят, условно говоря, как коробочка, которую можно запустить на спутнике. В будущем ядерные часы, вероятно, будут сначала большего размера — скорее как лаборатория, но со временем их можно будет усовершенствовать до более компактных объемов.
«Такие часы безопасны абсолютно, это никак не связано с ядерными реакциями», — отмечает Глазов.
Исследователи ИТМО, Петербургского института ядерной физики и СПбГУ работают в области теории ядерного перехода: уже опубликованы научные статьи, которые могут быть использованы при создании новых сверхточных часов.
В астрофизике же научный прорыв — 2024 связан с работой космического телескопа «Джеймс Уэбб», которому удается открывать древнейшие галактики, недоступные для наблюдения человечеством ранее. Это орбитальная инфракрасная обсерватория, которая представляет собой самый крупный космический телескоп с самым большим зеркалом из когда-либо запущенных людьми. «Джеймс Уэбб» отправили в космос в 2021 году, этот проект стал результатом сотрудничества 17 стран.
«Он исследует ранние галактики на самом раннем этапе развития Вселенной, и то, что там наблюдается, не соответствует известным космологическим моделям. То есть это не совпадает с тем, как ученые представляли себе развитие этих галактик», — рассказывает Глазов.
Инфохимия: Самая быстрая Нобелевка, лаборатории
Директор научно-образовательного центра инфохимии ИТМО, профессор Екатерина Скорб рассказала «Фонтанке», что, безусловно, главное событие 2024 года в этой области — Нобелевская премия по химии. Ее получили Дэвид Бейкер, Демис Хассабис и Джон Джампер за два открытия. Бейкер опубликовал прорывное исследование о компьютерном синтезе белка, не имеющего аналогов в природе. А Хассабис и Джампер разработали алгоритм AlphaFold, который с рекордной точностью предсказывает трехмерную структуру белка по его аминокислотной последовательности.
«Это одна из самых „быстрых“ Нобелевских премий. В 2018 году был первый релиз программы, в 2020-м ее довели до такого уровня, что она была признана научным сообществом как передовая. Уже в 2024-м — Нобелевская премия. Это очень вдохновляет наших студентов и молодых сотрудников, которые занимаются инфохимией», — отмечает Екатерина Скорб.
Инструменты, которые сейчас доступны, позволяют быстрее, чем раньше, генерировать новые молекулы и разрабатывать новые материалы. В химии происходят фактически революционные изменения, подчеркивает профессор.
Ключевые научные публикации 2024 года были связаны с тем, как оптимально организовать самоподдерживающиеся лаборатории (self-driving laboratories). Этим занимаются несколько групп исследователей, в том числе в ИТМО.
Самоподдерживающиеся лаборатории оснащают всем необходимым оборудованием для синтеза молекул и изготовления необходимых материалов, сами операции проводят коллаборативные роботы: каждый из них выполняет определенное действие по заданной учеными программе.
«Фактически вокруг такой лаборатории выстраивается система формата „интернет вещей“, включающая в себя систему поддержки принятия решений исследователем, электронных лабораторных журналов, возможности экспериментально подтверждать те модели, которые предлагаются», — рассказывает Екатерина Скорб.
Существуют в том числе мобильные самоподдерживающиеся лаборатории, которые разрабатываются для школ.
«Те образовательные проекты, которые мы предлагаем делать старшеклассникам, очень полезны нам, потому что они собирают базу данных, которые могут быть использованы для обучения моделей», — отмечает профессор.
Экономика: последствия развития ИИ и изменений климата
О нескольких ярких достижениях экономической науки «Фонтанке» рассказала профессор, директор программ по направлению «Экономика» Школы вычислительных социальных наук Европейского университета в Петербурге Юлия Вымятнина.
«У каждого экономиста будут свои представления о самом значимом вкладе. <…> Думаю, вне зависимости от направления экономических исследований значимыми были осмысление и использование искусственного интеллекта, а также продолжающийся тренд на междисциплинарность. Уже не первое десятилетие в экономике наблюдается тренд на исследования более узких вопросов, по-настоящему новые, прорывные идеи появляются редко», — отмечает профессор.
В 2024 году экономисты исследовали влияние и внедрение ИИ в широком спектре направлений: от прогнозов экономических изменений в зависимости от скорости внедрения общего искусственного интеллекта (AGI) до применения больших языковых моделей в науке (для моделирования предпочтений, использования в качестве ассистентов-исследователей, сбора архивных данных).
Самые важные направления в этой области на сегодня:
Регулирование ИИ. От этого зависит, получат ли крупнейшие игроки на этом поле возможность использовать свою власть, принесет ли широкое внедрение ИИ рост благосостояния, ощутимый для всех или только для избранных, как изменится рынок труда.
Использование ИИ в научных исследованиях.
Изучение предпочтений: насколько хорошо большие языковые модели улавливают предпочтения людей (в том числе в финансовых вопросах) и могут быть использованы как «советники по инвестициям», могут ли заменить собой эксперименты на людях.
Знаковыми для этих направлений стали работы Антона Коринека из университета Вирджинии. В частности, в одной из своих новых работ ученый исследует, как ИИ влияет на структуру рынка и конкуренцию, почему он может способствовать большей концентрации власти и появлению естественных монополий, какие политические меры могут поддержать конкурентный рынок в таких условиях. В работе «Проблемы экономической политики в эпоху ИИ» Коринек изучает, как ИИ трансформирует базовую структуру экономики, уменьшая роль человеческого труда и ставя под вопрос прежнее распределение доходов, рабочих мест, ценность образования. Он выделяет ключевые вопросы в эпоху ИИ, среди которых неравенство и распределение доходов, социальная и политическая стабильность, антимонопольное регулирование, интеллектуальная собственность и экологические последствия.
Профессор Юлия Вымятнина отмечает, что анализ экономических последствий изменения климата — пожалуй, вторая по важности тема научных исследований. В тренде уже не первый год остается анализ влияния на экономические показатели редких неблагоприятных событий. В этой области экономисты объединяют усилия с другими учеными, которые занимаются прогнозированием природных катастроф. Сейчас в фокусе внимания:
Влияние природных катастроф на экономику в целом: насколько сильно экономика страны или региона страдает от природного явления, как быстро происходит восстановление.
Влияние природных катастроф на отдельные секторы экономики, в первую очередь — на финансовый сектор. «С точки зрения стабильности системы важно уметь хорошо прогнозировать такие события, причем в региональном разрезе. Хороший прогноз позволяет не только предотвращать часть ущерба, но и более адекватно планировать работу страховых компаний, банков», — отмечает Вымятнина.
Влияние природных катастроф на здоровье людей. Здесь большое внимание стараются уделять психическому здоровью, поскольку эти эффекты, с одной стороны, часто игнорируются, а с другой — оказывают длительное влияние в целом на здоровье и работоспособность человека.
«В этой области тоже может появиться связка с ИИ — через исследования рынка электроэнергии в условиях неблагоприятных климатических событий, поскольку в последние годы серьезными драйверами спроса на электроэнергию являются криптовалюты и искусственный интеллект», — подчеркивает профессор.
В этих направлениях работают десятки исследователей-экономистов, поэтому какое-либо одно-два ключевых направления за 2024 год выделить сложно, отмечают в ЕУ.
ИИ: Новая модель нейросетей
Научный руководитель и исполнительный директор лаборатории «Искусство и искусственный интеллект» Европейского университета в Петербурге Олег Лашманов назвал три ключевых открытия в области искусственного интеллекта.
В 2024 году были опубликованы научные наработки по новой модели нейронных сетей — KAN. Она представляет собой альтернативу классической модели «перцептрон», которая действует по аналогии с работой головного мозга: с участием сенсоров, ассоциативных и реагирующих элементов. KAN состоит из обучаемых одномерных функций, ее узлы просто суммируют входящие сигналы.
«Это новый подход к построению алгоритмов, основанный на усложнении слоёв сети в обмен на бóльшую точность. В результате алгоритмы быстрее учатся и их легче интерпретировать. Если у перцептрона только одна фиксированная функция активации, у KAN она изменяется в процессе обучения, более того, нет весов в классическом смысле слова, вместо этого используются параметры аппроксимирующих функций-сплайнов», — рассказывает Олег Лашманов.
Функция активации — это преобразование, которое применяется к поступившим на вход данным. Благодаря таким функциям нейросети способны порождать более информативные описания признаков. Вес — это как бы важность, которой наделен сигнал. Сплайн — функция, которая на каждом отрезке является многочленом, а на всем заданном отрезке непрерывна вместе с несколькими своими производными. Аппроксимация — это по сути «приближение», которое заключается в замене одной функции другой таким образом, чтобы это удовлетворяло в некоторой области определенному условию.
Ученый поясняет, что в классических сетях каждый перцептрон — это линейная функция. Несколько перцептронов вместе тоже представляют собой линейную функцию, то есть просто прямую. Но на практике большинство задач требуют нелинейности, которой добиваются с помощью функции активации. Для этого после каждого нейрона добавляют нелинейную функцию. Разновидностей таких функций много, но сами они не изменяются в процессе обучения. Поэтому для них подбирают коэффициенты, которые называют обучаемыми параметрами или весами. В новом подходе, KAN, предложено не фиксировать функции активации во время обучения. Для достижения их изменчивости в KAN используют сплайн-функции. Особенность этого можно описать так: если у школьной параболы всегда есть один «горб», как ни меняй коэффициенты в уравнении, у сплайнов же может быть разное количество «горбов», в зависимости от коэффициентов.
«KAN потенциально могут стать базовой моделью для AI + Science благодаря их точности и интерпретируемости», — отмечает международная группа исследователей, опубликовавшая научную работу (перевод с английского).
Название модели отсылает к фамилиям советских математиков Андрея Колмогорова и Владимира Арнольда. Она разработана на основе их теоремы, которую до этого считали бесперспективной с точки зрения применения к ИИ.
«KAN можно использовать для научных открытий. Мы используем два примера, из математики и физики, чтобы продемонстрировать, что KAN могут быть полезными „соавторами“ для ученых в открытии математических и физических законов», — сказано в научной публикации (перевод с английского).
Еще одно важное исследование 2024 года указало на самое узкое место в масштабировании архитектуры трансформеров. Это самая распространенная на сегодня архитектура глубоких нейронных сетей. Она предназначена для решения таких задач, как машинный перевод и автоматическое реферирование (создание краткой версии текста).
«В частности, статья указывает на то, что масштабирование трансформеров сетей упрется в пропускную способность памяти компьютеров и для дальнейшего прогресса придется изобретать другую архитектуру сетей, не получится просто завалить всё вычислительными мощностями», — поясняет Олег Лашманов.
Международная группа исследователей в статье AI and Memory Wall (ИИ и «Стена памяти») отмечает, что за последние 20 лет пиковая вычислительная мощность оборудования увеличилась в 60 000 раз, в то время как мощность DRAM (тип памяти, который широко используется в оперативных запоминающих устройствах) — всего в 100 раз, пропускная способность межсоединений — в 30 раз.
«Память — в частности, передача данных внутри/между чипами памяти — скоро станет основным ограничивающим фактором в обслуживании больших моделей ИИ. Поэтому нам необходимо переосмыслить обучение, развертывание и проектирование моделей ИИ, а также то, как мы проектируем аппаратное обеспечение ИИ, чтобы справиться с этой все более сложной стеной памяти», — резюмировали авторы статьи.
Третьим ключевым открытием в области искусственного интеллекта стало исследование KVQuant. Международная группа ученых разработала новый метод сжатия кэша KV, актуальный для работы с большими языковыми моделями.
«Из статьи мы узнаём, как сократить вычислительные издержки при использовании генеративных сетей в 10–100 раз. Значит, такие сети будут доступнее», — отмечает Олег Лашманов.
Генеративный искусственный интеллект используют для создания новых данных, неотличимых от созданных человеком: это могут быть тексты, изображения или музыка. Алгоритмы сначала обучаются на больших объемах данных, а потом генерируют новые образцы. Это требует значительных ресурсов, поэтому без эффективного сжатия с сохранением ключей и значений (KV) не обойтись.
Новые возможности для людей с инвалидностью
«Фонтанка» изучила публикации о научных открытиях в 2024 году и выбрала еще одно событие года. В октябре инженеры южнокорейского института KAIST представили роботизированный экзоскелет WalkON Suit F1, который предназначен для людей с параличом ног. Он может сам подходить к человеку и «наклоняться», чтобы его надели, сохраняя при этом устойчивость. Таким образом, люди с инвалидностью получили возможность надевать на себя экзоскелет самостоятельно и без необходимости пересаживаться из инвалидного кресла.
Этот тип экзоскелета предназначен для реабилитации людей с нарушениями опорно-двигательного аппарата. Первую его версию разработали в 2016 году, к 2020-му он уже мог преодолевать разные препятствия и развивать скорость ходьбы до 3,2 километра в час. Но всё это время людям с инвалидностью нужна была помощь, чтобы такой экзоскелет надеть. В 2024 году эта проблема была решена.
«Техническое решение фундаментальной проблемы заключается в том, что происходит стыковка спереди, вам не нужно садиться в экзоскелет, вы его просто надеваете, не выходя из инвалидной коляски», — объясняют разработчики.
Такой экзоскелет — важный шаг для полноценной жизни и реабилитации людей с инвалидностью.
Анна Мотовилова, «Фонтанка.ру»