XX.F.548
Анализ результатов эксперимента по созданию опорных выборок на больших территориях с помощью краудсорсинга
Ёлкина Е.С. (1), Плотников Д.Е. (1), Толпин В.А. (1), Щербенко Е.В. (2)
(1) Институт космических исследований РАН, Москва, Россия
(2) ООО "ИКИЗ", Москва, Россия
Задачи картографирования растительного покрова с использованием алгоритмов контролируемого машинного обучения включают в себя сбор и подготовку опорных выборок для обучения классификатора. Для картографирования объектов различного типа землепользования на больших территориях, в том числе, используемых пахотных земель, требуется пространственно-распределенная и точная обучающая выборка (Барталев и др., 2011; Плотников и др., 2019). Вопрос наличия такой выборки особенно актуален для ряда эпох и территорий, где точность других источников информации вызывает сомнения (Waldner F. et al., 2018). В этом контексте интерес представляет разработка методов создания обучающих наборов контролируемой точности на большие территории, которые позволили бы минимизировать труд экспертов и отказаться от дорогостоящих наземных обследований. Одним из вариантов получения необходимых данных может быть организация краудсорс-разметки (Li G. et al., 2016). В настоящей работе представлены методы и результаты анализа опорных данных, полученных с помощью краудсорс-фотоинтерпретации спутниковых изображений.
В целях исследования опорной выборки для распознавания пахотных земель с помощью краудсорсинга был организована экспериментальная платформа, на основе которой по спутниковым данным проводилась разметка объектов наземного покрова как экспертами в области дистанционного зондирования Земли (ДЗЗ), так и обычными участниками («волонтёрами»). Все участники определяли объекты двух классов: пашня и не-пашня (бинарная классификация) по всем доступным спутниковым данным высокого разрешения (прежде всего, Sentinel-2 и Landsat) на 2017 год. В качестве платформы, предоставляющий доступ к спутниковым данным и инструментам аннотирования объектов, использована разработанная в ИКИ РАН система Вега-Science (Лупян и др.,2021; Толпин и др., 2018).
Эксперимент призван ответить на следующие вопросы: (i) позволяет ли предлагаемый подход объективно контролировать точность выборки?; (ii) какие метрики оценки качества выборки целесообразно использовать и каково распределение их значений?; (iii) как обеспечить качество данных для анализа, какая необходима предобработка?; (iv) наблюдаются ли какие-либо пространственные тенденции точности на больших территориях?; (v) насколько и где можно снизить вклад экспертов, не потеряв в качестве краудсорс-выборки? В докладе представлены результаты обработки полученных в ходе эксперимента данных и их анализ, который позволяет оценить применимость краудсорс-подхода к созданию опорных выборок и возможность его масштабирования для картографирования используемой пашни для различных регионов РФ. Доклад состоит из трех частей: в первой описываются условия эксперимента, во второй части описаны методы оценки качества получаемых выборок и представлены полученные точности, в третьей описаны выявленные пространственные тенденции.
Работа выполняется с использованием ресурсов ЦКП "ИКИ-Мониторинг" (Лупян и др., 2019) при поддержке Минобрнауки (тема "Мониторинг", госрегистрация № 122042500031-8).
Ключевые слова: опорная выборка, краудсорсинг, фотоинтерпретация, используемые пахотные земли, ВЕГАЛитература:
- Барталев С.А., Егоров В.А., Лупян Е.А., Плотников Д.Е., Уваров И.А. Распознавание пахотных земель на основе многолетних спутниковых данных спектрорадиометра MODIS и локально-адаптивной классификации - Компьютерная оптика. Самара. ИСОИ РАН. 2011. Т.35. № 1. С. 103-116.
- Лупян Е.А., Прошин А.А., Бурцев М.А., Кашницкий А.В., Балашов И.В., Барталев С.А., Бриль А.А., Егоров В.А., Жарко В.О., Константинова А.М., Кобец Д.А., Мазуров А.А., Марченков В.В., Матвеев А.М., Миклашевич Т.С., Плотников Д.Е., Радченко М.В., Стыценко Ф.В., Сычугов И.Г., Толпин В.А., Уваров И.А., Хвостиков С.А., Ховратович Т.С. Система "Вега-Science": особенности построения, основные возможности и опыт использования // Современные проблемы дистанционного зондирования Земли из космоса. 2021. Т. 18. № 6. С. 9-31. DOI: 10.21046/2070-7401-2021-18-6-9-31.
- Лупян Е.А., Прошин А.А., Бурцев М.А., Кашницкий А.В., Балашов И.В., Барталев С.А., Константинова А.М., Кобец Д.А., Мазуров А.А., Марченков В.В., Матвеев А.М., Радченко М.В., Сычугов И.Г., Толпин В.А., Уваров И.А. Опыт эксплуатации и развития центра коллективного пользования системами архивации, обработки и анализа спутниковых данных (ЦКП «ИКИ-Мониторинг») // Современные проблемы дистанционного зондирования Земли из космоса. 2019. Т. 16. № 3. С. 151-170. DOI: 10.21046/2070-7401-2019-16-3-151-170.
- Плотников Д.Е., De Abelleyra D., Veron S.R., Zhang M., Толпин В.А., Барталев С.А., Lavreniuk M., Waldner F., Ziad A. Картографирование пахотных земель в различных регионах глобальной сети JECAM на основе спутниковых данных Landsat и полученной методом краудсорсинга опорной информации // "Информационные технологии в дистанционном зондировании Земли - RORSE 2018". ИКИ РАН, 2019. С. 177-184. DOI: doi.org/10.21046/rorse2018.177.
- Толпин В.А., Закора А.Л., Плотников Д.Е., Ёлкина Е.С., Козочкина А.А. Инструментарий оценки используемости сельскохозяйственных земель в информационных системах семейства «Созвездие-ВЕГА» // "Информационные технологии в дистанционном зондировании Земли - RORSE 2018". ИКИ РАН, 2019. С. 279-286. DOI: doi.org/10.21046/rorse2018.279.
- Li G., Wang J., Zheng Y., Franklin M.J. Crowdsourced Data Management: A Survey // IEEE Transactions on Knowledge and Data Engineering. 2016 vol. 28 no. 9 pp. 2296–2319.
- Waldner F., Schucknecht A., Lesiv M., Gallego J., See L., Pérez-Hoyos A., d’Andrimont R., de Maet T., Laso Bayas J.C., Fritz S., Leo O., Kerdiles H., Díez M., Van Tricht K., Gilliams S., Shelestov A., Lavreniuk M., Simões M., Ferraz R., Bellón B., Bégué A., Hazeu, G., Stonacek V., Kolomaznik J., Misurec J., Veron S.R., De Abelleyra D., Plotnikov D.E., Mingyong L., Singha M., Patil P., Zhang Y., Defourny, Р. Conflation of expert and crowd reference data to validate global binary thematic maps // Remote Sensing of Environment. 2019. Vol. 221. P. 235–246. DOI: 10.1016/j.rse.2018.10.039.
- URL: sci-vega.ru
Презентация доклада
Ссылка для цитирования: Ёлкина Е.С., Плотников Д.Е., Толпин В.А., Щербенко Е.В. Анализ результатов эксперимента по созданию опорных выборок на больших территориях с помощью краудсорсинга // Материалы 20-й Международной конференции «Современные проблемы дистанционного зондирования Земли из космоса». Москва: ИКИ РАН, 2022. C. 353. DOI 10.21046/20DZZconf-2022aДистанционное зондирование растительных и почвенных покровов
353