Семнадцатая Всероссийская Открытая конференция «СОВРЕМЕННЫЕ ПРОБЛЕМЫ ДИСТАНЦИОННОГО ЗОНДИРОВАНИЯ ЗЕМЛИ ИЗ КОСМОСА (Физические основы, методы и технологии мониторинга окружающей среды, потенциально опасных явлений и объектов)»
XVII.A.451
Инструмент ручной разметки спутниковых изображений для дообучения нейросетевых алгоритмов
Гусев В.В. (1), Мясоедов А.Г. (1), Топоров А.И. (1)
(1) Цифровое Проектирование, Санкт-Петербург, Россия
Задачи дистанционного зондирования поверхности Земли предполагают обработку значительных объемов графической информации. Это влечет трудозатраты, которые становятся особенно ощутимы при необходимости привлечения высококвалифицированных экспертов. Одним из способов решения данной проблемы является применение автоматизированных методов разметки подобных данных, в том числе и с помощью машинного обучения.
К сожалению, во многих ситуациях даже использование современных алгоритмов не способно гарантировать полностью автоматизированную разметку. Таким образом, изображения, которые не смогла классифицировать программа, либо остаются неразмеченными, либо подлежат обработке человеком. Это необходимо, например, в ситуации, когда требуется более полно обработать данные, чем было обеспечено применением автоматизированных методов. Кроме того, “ручная” разметка позволяет впоследствии дообучить алгоритмы, с тем чтобы снизить вероятность их отказа в будущем.
В данной работе речь пойдет именно о таком инструменте “ручной разметки”, входящем в состав программного комплекса для автоматической обработки и анализа спутниковых изображений, разрабатываемого в ООО “Цифровое проектирование”. Внимание уделяется вопросам потенциальных сценариев применения подобного инструмента, требований к нему и внедрения в систему обработки графических данных.
В качестве результата проделанной работы представлен прототип, предназначенный для использования с алгоритмами, определяющими присутствие искомого объекта на изображении. Иными словами, прототип предназначен для работы с проблемой классификации изображений по признаку наличия объектов заданного типа. Пользователь имеет возможность вручную классифицировать обнаруживаемые в базе данных проекта изображения, на которых имеются области, не поддающиеся автоматизированной разметке.
Ключевые слова: Sentinel, разметка данных, маска облаков, маска дорог, машинное обучение, сверточная нейронная сеть, CNN
Методы и алгоритмы обработки спутниковых данных
28