Google выпустила модель искусственного интеллекта (ИИ), которая, по утверждению компании, может генерировать точные прогнозы погоды в больших масштабах, но при этом обходится дешевле, чем традиционные прогнозы, основанные на физике.
Модель «Scalable Ensemble Envelope Diffusion Sampler» (SEEDS) разработана аналогично популярным большим языковым моделям (LLM), таким как ChatGPT, и генеративным инструментам искусственного интеллекта, таким как Sora, которые генерируют видео из текстовых подсказок.

SEEDS генерирует множество ансамблей — или несколько погодных сценариев — гораздо быстрее и дешевле, чем традиционные модели прогнозирования. Команда описала свои выводы в статье, опубликованной 29 марта в журнале Science Advances.
Погоду трудно предсказать, поскольку существует множество переменных, которые могут привести к потенциально разрушительным погодным явлениям — от ураганов до волн жары. Поскольку изменение климата ухудшается, а экстремальные погодные явления становятся всё более распространёнными, точное предсказание погоды может спасти жизни, давая людям время подготовиться к наихудшим последствиям в результате стихийных бедствий.
Прогнозы, основанные на физике, которые в настоящее время используются метеорологическими службами, собирают различные измерения и дают окончательный прогноз, который усредняет множество различных смоделированных прогнозов — или ансамблей — на основе всех переменных. Вместо единого прогноза прогнозирование погоды основано на наборе прогнозов для каждого цикла прогнозирования, который обеспечивает диапазон возможных будущих состояний.
Это означает, что большинство прогнозов погоды достаточно точны для более распространённых условий, таких как мягкая погода или тёплые летние дни, но создание достаточного количества прогнозных моделей для определения вероятного результата экстремального погодного явления для большинства служб, увы, недоступно.
В текущих прогнозах также используются детерминистические, или вероятностные модели прогнозирования, в которых в начальные условия вводятся случайные переменные. Однако стоит признать, что это приводит к быстрому увеличению частоты ошибок, а это означает, что точно предсказать экстремальную погоду и погоду в будущем будет трудно.
Непредвиденные ошибки в начальных условиях также могут существенно повлиять на результат прогнозирования, поскольку переменные со временем растут в геометрической прогрессии, а моделирование достаточного количества прогнозов для учёта переменных с точностью до таких мельчайших деталей обходится дорого. Учёные же из Google оценили, что для прогнозирования событий, вероятность которых составляет всего 1%, в модели необходимо 10 тыс. прогнозов.
SEEDS создает модели прогнозирования на основе физических измерений, собранных метеорологическими агентствами. В частности, он анализирует взаимосвязь между потенциальной энергией на единицу массы поля гравитации Земли в средней тропосфере и давлением на уровне моря — двумя общепринятыми мерами, используемыми в прогнозировании.
Традиционные методы позволяют получить ансамбли примерно из 10-50 предсказаний. Но с помощью искусственного интеллекта текущая версия SEEDS может экстраполировать до 31 ансамбля прогнозов на основе всего лишь одного или двух «затравочных прогнозов», используемых в качестве входных данных.
Исследователи протестировали систему, смоделировав волну жары в Европе в 2022 году, используя исторические данные о погоде, зарегистрированные в то время. Всего за 7 дней до аномальной жары данные оперативного ансамбля прогнозирования в США не давали никаких указаний на то, что подобное событие вообще маячит на горизонте, сообщили представители Google в блоге своего исследовательского портала. Они добавили, что ансамбли с менее чем 100 предсказаниями — что больше, чем обычно, — также пропустили бы это.
Учёные описали вычислительные затраты, связанные с выполнением вычислений с начальными данными, как «незначительные» по сравнению с современными методами. Google сообщает, что система искусственного интеллекта также имела пропускную способность в 256 ансамблей на каждые 3 минуты обработки в образцовой облачной архитектуре Google, которую можно легко масштабировать, привлекая больше ускорителей.