Восьмая всероссийская открытая ежегодная конференция
«Современные проблемы дистанционного зондирования Земли из космоса»
Москва, ИКИ РАН, 15-19 ноября 2010 г.
(Физические основы, методы и технологии мониторинга окружающей среды, природных и антропогенных объектов)
VIII.B.332
Оценка рисков на основе геопространственной информации с применением ансамблевого подхода к анализу и технологий слияния разнородных данных
Куссуль Н.М., Зелык Я.И., Скакун С.В., Шелестов А.Ю.
Институт космических исследований Национальной академии наук Украины и Национального космического агентства Украины (ИКИ НАНУ-НКАУ)
При принятии решений, касающихся защиты от воздействия стихийных бедствий на население, социально-экономические объекты и среду, возникает проблема оценивания рисков неблагоприятных последствий от воздействия различных факторов окружающей среды на значительных территориях. Исходная информация для решения проблемы оценивания такого рода рисков содержится в разнородных геопространственных данных (спутниковых, наземных данных моделирования), касающихся конкретного региона, различных характеристик территории, объектов и факторов внешней среды. Мера риска пропорциональна ожидаемым потерям, которые могут быть причинены рисковым событием, и вероятности этого события. В настоящее время в мире существуют системы оценки рисков в операционном режиме. Однако используемые в таких операционных системах методы оценки рисков зачастую являются слишком упрошенными, и не опираются на достаточно развитый математический аппарат оценки среднего риска по эмпирическим данным, разработанный для задач оценивания качества восстановления функциональных зависимостей на основе эмпирических данных, который применяется в статистической теории обучения.
Поставлена задача оценки рисков, связанных со стихийными бедствиями на основе разнородной геопространственной информации и предложен и обоснован метод ее решения.
Введено понятие совокупного ожидаемого риска последствий стихийного бедствия (совокупных ожидаемых потерь) в некоторой области, который определяется в результате интегрирования по всей области локального риска в каждой ее точке. Локальный ожидаемый риск последствий стихийного бедствия в некоторой точке области вычисляется как значение функционала среднего риска, который представляет собой математическое ожидание функции ущерба последствий бедствия в этой позиции. Неизвестная плотность вероятностей стихийного бедствия в точке зависит от различных факторов окружающей среды, которые могут быть прямо или косвенно измерены с помощью наземных средств и дистанционных методов, либо получены с помощью моделирования. Восстанавливаема плотность вероятности параметризована и для ее оценивания могут быть использованы различные методы параметрических статистик: метод максимального правдоподобия, метод Байесовых оценок и др. Для оценки плотности вероятности стихийного бедствия анализируется (классифицируется) информация, поступающая из различных источников с различным временным и пространственным разрешением. Совместный анализ такой информации выполняется с применением ансамблевого подхода и реализацией методов и технологий слияния данных (data fusion).
Система для оценивания плотности вероятности стихийного бедствия состоит из ансамбля отдельных («слабых) классификаторов (решающих правил), каждый из которых обеспечивает результат анализа данных одного или нескольких источников. Агрегированные в систему ансамблевой обработки данных, отдельные классификаторы составляют ансамбль экспертов («сильный» классификатор), «мнения» которых с соответствующими весами учитываются в блоке слияния, на выходе которого в результате реализации машинного обучения получается с высокой точностью оценка плотности вероятности стихийного бедствия. Преимуществом ансамблевого метода классификации является возможность повышения точности классификации за счет приема «усиления» (boosting), который сводится к оценке функции потерь (ошибки классификации) и минимизации этой функции путем добавления новых компонентных классификаторов до тех пор, пока очередное добавление не снижает значение функции потерь. В качестве классификаторов могут использоваться следующие обработчики данных: нейронные сети, прогнозирующие математические модели процессов (в зависимости от предметной области), классификаторы по принципу максимума правдоподобия, классификаторы на основе Байесовых оценок и др.
В докладе рассматривается пример практического применения предложенного подхода к оценке риска затоплений в Намибии.
Технологии и методы использования спутниковых данных в системах мониторинга
86