ОС и софт

Как ЦЕРН «зашивает» ИИ в чипы для мгновенного анализа данных с БАК

Инфраструктура искусственного интеллекта для Большого адронного коллайдера (БАК) кардинально отличается от стандартных систем на базе TPU или GPU. Как сообщает The Register, специалисты ЦЕРНа (CERN) фактически «впечатывают» специализированные ИИ-алгоритмы прямо в кремниевые чипы, чтобы отбирать колоссальные потоки информации практически мгновенно.

Каждый год установка производит около 40 тысяч эксабайт необработанных данных с датчиков — это сравнимо с четвертью всего объёма информации в интернете. Сохранить такие массивы ЦЕРН не в состоянии, поэтому критически важно мгновенно определять, какие сведения имеют научную ценность. Поток достигает сотен терабайт в секунду, и алгоритмы для его обработки должны быть сверхбыстрыми. Именно поэтому их «зашивают» непосредственно в аппаратное обеспечение.

В 27-километровом туннеле БАК субатомные частицы сталкиваются со скоростями, приближенными к световым. По кольцу циркулируют примерно 2,8 тысячи сгустков протонов с интервалом в 25 наносекунд. Несмотря на контроль учёных, столкновения происходят относительно редко: из миллиардов протонов в каждом цикле взаимодействуют лишь около 60 пар. В результате рождаются новые частицы, которые регистрируют детекторы ЦЕРНа.

Источник изображения: Brandon Style/unsplash.com

Каждое взаимодействие пары частиц создаёт несколько мегабайт данных. При частоте около миллиарда столкновений в секунду совокупный объём информации приближается к одному петабайту. Очевидно, что собирать и хранить всё в исходном виде технически нереально, поэтому в ЦЕРНе разработали масштабную вычислительную систему, которая на уровне детекторов разделяет данные на «перспективные» и «фоновые».

Источник изображения: Thea Klaeboe Aarrestad (ETH Zürich)

В детекторах для временного хранения данных применяются ASIC-микросхемы, которые удерживают информацию не дольше 4 микросекунд — после этого она либо сохраняется, либо безвозвратно теряется. Решение о сохранении принимает система первичного отбора (Level One Trigger), построенная на основе примерно тысячи FPGA-чипов. Эти чипы получают данные по оптическим каналам со скоростью порядка 10 Тбайт/с. Анализ происходит непосредственно внутри микросхем в реальном времени, по мере поступления сигналов — даже самое быстрое внешнее запоминающее устройство не способно обработать подобный поток. Специализированный алгоритм AXOL1TL выносит вердикт за время не более 50 наносекунд. В итоге сохраняется лишь около 0,02 % информации о столкновениях, что соответствует приблизительно 110 тысячам событий каждую секунду. Отобранные данные передаются на поверхность, но даже после такой жёсткой фильтрации ежесекундно требуется передавать терабайты информации.

Источник изображения: Thea Klaeboe Aarrestad (ETH Zürich)

На поверхности вступает в работу второй фильтр — High Level Trigger, который сокращает поток до примерно тысячи событий в секунду. Эта система использует 25,6 тысяч центральных процессоров и 400 графических процессоров для реконструкции столкновений и выбора наиболее значимых с научной точки зрения. В результате формируется около 1 Петабайта новых данных ежедневно. Эти данные распределяются между 170 научными организациями в 42 странах, где их изучают исследователи со всего мира. Совокупная вычислительная мощность всех участников проекта достигает примерно 1,4 миллиона ядер. Цель CERN — измерять параметры столкновений с точностью 99,999 %, что является «золотым стандартом» для заявлений о новых научных открытиях.

Источник изображения: Thea Klaeboe Aarrestad (ETH Zürich)

Стандартные средства искусственного интеллекта оказались непригодны для систем обнаружения, поэтому специалистам ЦЕРН потребовалось создать собственную технологическую платформу. Модели ИИ, применяемые на Большом адронном коллайдере, были специально оптимизированы, усовершенствованы, адаптированы для параллельных вычислений и «натасканы» на выделение исключительно значимой информации. В контексте БАК они демонстрируют сопоставимую эффективность, но существенно экономичнее обычных машинно-обучаемых систем. Для внедрения моделей в аппаратное обеспечение используется компилятор HLS4ML, преобразующий их в код на C++, который может выполняться на ИИ-ускорителях, системах на кристалле, специализированных ПЛИС и даже прошиваться в виде заказных интегральных схем. При этом существенная доля ресурсов микросхемы выделена не на выполнение алгоритма, а на хранение таблиц с заранее вычисленными результатами для стандартных входных значений, что позволяет ускорить фильтрацию данных.

 Источник изображения: CERN

Источник изображения: CERN

В конце текущего года БАК остановит работу, а новый, более мощный коллайдер High Luminosity LHC планируется запустить в 2031 году. Он будет оснащён более сильными магнитами для фокусировки частичных пучков, сами пучки увеличатся вдвое, установка станет генерировать в 10 раз больше данных, а размер информации от каждого столкновения возрастёт с 2 до 8 мегабайт. ЦЕРН уже накопил 1 эксабайт данных с БАК, но это лишь малая часть от того объёма, который предстоит хранить и обрабатывать в ближайшее десятилетие. И в то время как ведущие лаборатории ИИ создают всё более масштабные языковые модели, ЦЕРН движется в обратном направлении, стремясь максимально упростить и ускорить обнаружение аномальных событий с помощью искусственного интеллекта.

Источник:

Поделиться:

0 Комментариев

Оставить комментарий

Обязательные поля помечены *
Ваш комментарий *
Категории