en ru

Система усвоения данных

Рис. 1. Дрифтеры ARGO, данные за 30 суток (http://www.argo.ucsd.edu)
Рис. 1. Дрифтеры ARGO, данные за 30 суток (http://www.argo.ucsd.edu)
Рис. 2. Суточная выборка измерений аномалии уровня океана (SLA), полученная в режиме приближенного к реальному времени (near-real time) вдоль трека спутника Jason-2 [NASA Along-Track]. Jason-1(2,3)
Рис. 2. Суточная выборка измерений аномалии уровня океана (SLA), полученная в режиме приближенного к реальному времени (near-real time) вдоль трека спутника Jason-2 [NASA Along-Track]. Jason-1(2,3)
Рис. 3. (a) Двумерная процессорная декомпозиция области, используемая в модели океана ИВМИО (показана прямоугольниками); (b) одномерная процессорная декомпозиция, используемая при усвоении данных, показана красным и черным пунктиром. Точками показаны данные наблюдений
Рис. 3. (a) Двумерная процессорная декомпозиция области, используемая в модели океана ИВМИО (показана прямоугольниками); (b) одномерная процессорная декомпозиция, используемая при усвоении данных, показана красным и черным пунктиром. Точками показаны данные наблюдений
Параллельный алгоритм ансамблевой оптимальной интерполяции (EnOI)

Разработаны математический аппарат и параллельные вычислительные алгоритмы метода обобщенной ансамблевой оптимальной интерполяции EnOI (Ensemble Optimal Interpolation) для усвоения данных наблюдений в модели динамики океана ИВМИО высокого пространственного разрешения на массивно-параллельных компьютерах с распределенной памятью.

Решение данной задачи невозможно без использования технологий распределенных вычислений в силу огромного объема получаемой и обрабатываемой информации. Количество ресурсов, необходимых для выполнения оперативных расчетов моделями высокого пространственного разрешения, исчисляется сегодня 10^2 – 10^3 вычислительных ядер для краткосрочных прогнозов и 10^4 – 10^5 – для средне- и долгосрочных. Уже сейчас доступны спутниковые данные наблюдений за поверхностной температурой и уровнем с разрешением 1 км (NASA Aqua). Это соответствует поступлению информации примерно 10 ГБ в сутки. И важно эту информацию правильно и быстро усвоить, особенно когда пространственное разрешение глобальных моделей океана станет составлять порядка километра.

Вопрос времени усвоения данных становится критичным в случае, когда система усвоения функционирует в оперативном режиме для построения среднесрочных и краткосрочных прогнозов. Время выдачи современных спутниковых данных наблюдений составляет ~ 2 часа.

Отличительной чертой методов, основанных на ансамблевой оптимальной интерполяции EnOI (Ensemble Optimal Interpolation) и ансамблевых фильтрах Калмана EnKF (Ensemble Kalman Filter) является то, что они не требуют построения сопряженного оператора модели и решения обратной задачи, что для модели с большим числом параметров весьма затруднительно, и вообще используют модель как «черный ящик». Такие методы хорошо распараллеливаются и вполне применимы для глобальных моделей (Schiller, Brassington, 2011).

Характеристики данных наблюдений об океане

Ниже приведена справка по характеристикам данных наблюдений за океаном, которые используются в экспериментах - это спутниковые данные температуры поверхности океана (ТПО) и данные спутниковой альтиметрии, а также данные с дрифтеров ARGO. Выводы сделаны на основе анализа источников данных наблюдений.

Дрифтеры ARGO (рис. 1):

• обеспечивают данными о температуре, солености и других параметрах океана для верхнего слоя океана (до 2 км);

• среднее расстояние между ними порядка 300 км;

• объем данных измерений – порядка 10^4 точек в сутки, 350 профилей за сутки;

• данные неравномерные;

• практически нет измерений для Северного Ледовитого океана и глубин более 2 км.

Спутниковые данные (рис. 2):

• данные ТПО (температуры поверхности океана) и альтиметрии доступны практически равномерно по всему Мировому океану между 66 с.ш. и 66 ю.ш.;

• расстояние между точками измерений Δx (вдоль трека) ~ 7 км;

• объем данных ~ 10^5-10^6 точек в сутки;

• только поверхность;

• спутниковые данные ТПО и альтиметрии вблизи полюсов носят пока экспериментальный характер, т.е. почти нет данных севернее 66° с.ш.

Параллельный алгоритм EnOI усвоения данных наблюдений

Параллельный метод ансамблевой оптимальной интерполяции (EnOI) подробно описан в работах (Кауркин, Ибраев, Беляев, 2016). В настоящее время метод EnOI используется для оперативного прогноза состояния океана в ряде систем, например см. Tanajura et al.,2014; Oke et al., 2010.

Модель динамики океана ИВМИО имеет параллельную реализацию для компьютеров с распределенной памятью на основе принципа двумерной декомпозиции области (рис. 3a), где каждую подобласть обсчитывает отдельное процессорное ядро. Но такой подход оказался не совсем подходящим при усвоении данных (Кауркин, Ибраев, Беляев, 2016), так как данные наблюдений (спутниковые или дрифтерные) распределены крайне неравномерно по расчётной области, поэтому для их обсчета используется своя процессорная декомпозиция, равномерная по этим данным (рис. 3b) и отдельные процессорные ядра. Описание программной реализации параллельного алгоритма и принципиальная схема передачи данных в рамках программного комплекса совместного моделирования CMF3.0 (Kalmykov, Ibrayev, Kaurkin, Ushakov, 2018) дана в работе (Kaurkin, Ibrayev, Koromyslov, 2016).

Параллельный алгоритм EnOI усвоения данных наблюдений реализован в виде блока DAS-EnOI (Data Assimilation System) Компактной вычислительной платформы для моделирования CMF3.0. Он позволяет усваивать в модели данные о параметрах состояния океана, являющихся решением модели. Данные о параметрах состояния океана могут быть со стационарных, мобильных и спутниковых измерителей.