Одиннадцатая Всероссийская открытая конференция "Современные проблемы дистанционного зондирования Земли из космоса"
XI.Z.535
Единая система детектирования и сопровождения сбоев в работе распределённых ИС ДЗЗ
Сычугов И.Г., Прошин А.А.
Институт космических исследований РАН
Разрабатываемые в отделе «Технологии спутникового мониторинга» ИКИ информационные системы доступа к спутниковым данным ДЗЗ зачастую реализуются на базе целого ряда территориально разнесенных центров приема и обработки спутниковых данных, причем в каждом из этих центров функционируют группы станций обработки и серверов архивации спутниковых данных. В результате мы получаем сложную распределенную информационную систему, в состав которой входят десятки серверов архивации и станций обработки спутниковых данных, оперирующих большим числом различных типов спутниковых данных и продуктов их обработки, в работе которой также задействованы десятки специалистов из различных организаций. Функционирование подобной системы не может происходить без различного рода сбоев и ошибок, вызванных неполадками с оборудованием, ошибками в программном коде, а также неправильными действиями персонала. Поэтому для обеспечения надежной работы такой сложной информационной системы просто необходимы оперативное обнаружение сбойных ситуаций и документирование работ по их своевременному устранению.
Для решения этой задачи нами была разработана специализированная система ведения сбоев, включающая в себя программные блоки для автоматического детектирования различных типов ошибок, блок оперативного оповещения об ошибках, а также WEB интерфейс, позволяющий фиксировать информацию о новых сбоях, а также получать и редактировать информацию об уже детектированных ошибках в работе системы. Для того чтобы систематизировать информацию о сбоях и облегчить задачу их занесения нами была реализована классификация типов сбоев по основным направлениям работ с указанием ответственных специалистов за каждое из направлений.
Ключевой особенностью разработанной системы является возможность использования единой системы ведения сбоев для осуществления поддержки бесперебойной работы целого ряда связанных между собой информационных систем доступа к спутниковым данных, что позволило организовать эти работы на качественно более высоком уровне.
Работа выполнена при поддержке РАН («Мониторинг» гос. регистрация № 01.20.0.2.00164).
Заседание в АО «Российские космические системы»: «Российская система спутниковых наблюдений и технологий: состояние и перспективы развития»
415