REMOTE SENSING

Dynamic World: 딥러닝 활용, 준 실시간 전세계 10m급 토지피복 분류

유병혁 2023. 7. 28. 07:51

안녕하세요? 이번 글은 준실시간(near real-time)으로 전세계 10m급 토지이용/피복 지도화를 제공하는 Dynamic World에 관해 간략히 소개해 보겠습니다.

 

Dynamic World(다이내믹 월드)

논문 바로가기: https://www.nature.com/articles/s41597-022-01307-4

일반적으로 거의 실시간으로 획득 및 처리되는 위성영상과 달리, 전세계 토지 피복 제품(global land cover products)은 역사적으로 연간 기준(annual basis)으로 생산되어 왔으며 종종 영상처리와 데이터셋 배포 사이에는 상당한 지연 시간(substantial lag times)을 두고 생산되었습니다.

 

Dynamic World는 10m급 Sentinel-2(센티널 2호) 영상에서 딥러닝(deep learning)을 활용하여 전세계적으로 일관된 준실시간(NRT: Near Real-Time) 토지이용/피복(LULC: Land Use Land Cover) 분류를 위해 개발된 새로운 자동화 접근 방식(automated approach)입니다.

 

확장성이 뛰어난 클라우드 기반 시스템을 활용하여 이 접근 방식을 적용하고 Sentinel-2 획득과 병행하여 LULC 예측의 개방적이고 지속적인 공급을 제공합니다. 통틀어 Dynamic World라고 부르는 이 최초의 NRT 제품은 최신 LULC 데이터에서 지정한 날짜 범위에 해당하는 맞춤형 글로벌 합성(custom global composites)에 이르기까지 다양한 사용자 요구를 수용합니다.

 

또한, 제품 출력의 지속적인 특성으로 인해 LULC 분류개선(refinement), 확장(extension)재정의(redifinition)할 수 있습니다. 이러한 고유한 속성이 결합되어, 다양한 분야의 다양한 사용자 커뮤니티에 전례 없는 유연성(unprecedented flexibility)을 제공합니다.

 

영상 전처리(Image preprocessing)

주석(annotation)과 훈련 워크플로(training workflows)를 모두 수용할 수 있도록 다양한 방법으로 Sentinel-2 이미지를 준비했습니다. 전처리 워크플로(preprocessing workflow)의 개요는 아래 그림과 같습니다.

그림 출처: https://www.nature.com/articles/s41597-022-01307-4

Sentinel-2 Level 2A 표면 반사율(SR: Surface Reflectance) 이미지를 사용하여 생성된 주석은 마스킹(cloud & shadow mask)되고 정규화(normalize)된 Sentinel-2 Level 1C 대기상부 반사율(TOA: Top of Atmosphere) 이미지와 쌍을 이루고, 입력은 모델링에 사용되는 훈련 입력(training inputs)을 생성하도록 증강(augmentation)됩니다.

 

S2 L2A SR은 주석에 유리하지만 2017년 이후부터 가능하므로 모델링 접근 방식은 2015년 Sentinel-2 프로그램 시작 이후 생성된 S2 L1C TOA를 사용했습니다.

 

모델 훈련(Model training)

감독 레이블 데이터(supervised label data)를 전세계 적용 시스템으로 전송하는 광범위한 접근 방식은 FCNN(Fully Convolutional Neural Network)을 훈련하는 것이었습니다.

 

LULC를 복구하는데 FCNN을 포함한 CNN 모델링을 적용하는 것은 새로운 아이디어가 아닙니다. 그러나 Dynamic World는 그라운드 레벨 카메라 이미지의 시멘틱 세그멘테이션(semantic segmention) 또는 회귀(regression)에 사용되는 아키텍처(특히 U-Net과 DeepLab v3+과 비교하여)보다 거의 100배 작은 신경망 아키텍처를 사용하여 전세계적으로 LULC에서 최신 성능을 달성하는 여러가지 새로운 혁신을 소개합니다.

 

그림 출처: https://www.nature.com/articles/s41597-022-01307-4

위 그림은 라벨링 모델(labeling model)을 복구하는 데 사용되는 훈련 프로토콜(training protocol)입니다. 맨 아래 행은 정규화된 Sentinel-2 L1C 이미지에서 클래스 확률(class probabilities), 합성된 Sentinel-2(synthesized Sentinel-2)로의 진행을 보여줍니다.

점선으로 표시된 빨간색과 파란색 화살표는 라벨링 모델이 클래스 확률과 합성 경로 모두에 대해 어떻게 최적화되는지 보여주고, 합성 모델은 합성 이미지에 대해서만 최적화됩니다.

 

데이터 기록(Data Records)

Dynamic World NRT 제품은 2015년 6월 27일부터 현재까지 전체 Sentinel-2 L1C 컬렉션에 사용할 수 있습니다. Sentinel-2의 재방문 빈도는 위도에 따라 2~5일 사이이지만, Dynamic World 이미지는 이 빈도의 약 절반(모든 위도에 걸쳐)으로 생성됩니다.

 

NRT 제품은 컬렉션 ID "GOOGLE/DYNAMICWORLD/V1" 아래 Earth Engine Image Collection으로 호스팅됩니다. 이는 ee.ImageCollection('GOOGLE/DYNAMICWORLD/V1')이 있는 Earth Engine Python 또는 JavaScript 클라이언트 라이브러리, https://developers.google.com/earth-engine/datasets/catalog/GOOGLE_DYNAMICWORLD_V1의 Earth Engine 데이터 카탈로그에서 참조됩니다.

 

그림 출처: https://www.nature.com/articles/s41597-022-01307-4

Sentinel-2 이미지(RGB) 및 해당 Dynamic World NRT 제품을 비교한 그림입니다. (a)는 브라질, (b)는 폴란드 지역입니다. "GOOGLE/DYNAMICWORLD/V1" 컬렉션의 이미지 밴드는 다음과 같습니다.

인덱스 밴드 이름 설명 데이터 유형 범위
0 water(수역) 수역에 의한 완전한 커버리지의 예상 확률 double (0, 1)
1 trees(수목) 수목에 의한 완전한 커버리지의 예상 확률 double (0, 1)
2 grass(초지) 초지에 의한 완전한 커버리지의 예상 확률 double (0, 1)
3 flooded_vegetation 침수 식생에 의한 완전한 커버리지의 예상 확률 double (0, 1)
4 crops(경작지) 경작지에 의한 완전한 커버리지의 예상 확률 double (0, 1)
5 shrub_and_scrub(관목 및 덤불) 관목 및 덤불에 의한 완전한 커버리지의 예상 확률 double (0, 1)
6 built(시가화지역) 시가화지역에 의한 완전한 커버리지의 예상 확률 double (0, 1)
7 bare(나지) 나지에 의한 완전한 커버리지의 예상 확률 double (0, 1)
8 snow_and_ice(설빙지역) 설빙지역에 의한 완전한 커버리지의 예상 확률 double (0, 1)
9 label(레이블) 예상 확률이 가장 높은 밴드의 인덱스 unsigned byte [0, 8]

 

Dynamic World와 다른 LULC 데이터셋의 비교

그림 출처: https://www.nature.com/articles/s41597-022-01307-4

(A) 브라질, (B) 노르웨이, (C) 미국의 검증 타일 위치에 대한 Dynamic World(DW)와 다른 전세계 및 지역 LULC 데이터셋을 시각적으로 비교한 그림입니다.

 

비교에 사용된 데이터셋은 다음과 같습니다:

  • 300m급 European Space Agency (ESA) Climate Change Initiative (CCI) 데이터셋
  • 100m급 Copernicus Global Land Service(CGLS) ProbaV Land Cover 데이터셋
  • 10m급 ESA Sentinel-2 Global Land Cover(S2GLC) Europe 2019 데이터셋
  • 30m급 MapBiomas Brazil 데이터셋
  • 30m급 USGS National Land Cover Dataset(NLCD) 데이터셋

 

클래스 확률의 시계열(Time series of class probabilities)

Dynamic World에는 각 픽셀에 대한 단일 "최고(bast)" 레이블 외에 클래스 확률이 포함됩니다. 여러 날짜 기간을 나타내기 위한 LULC 레이블을 제공하는 대신, Dynamic World는 피복 유형 확률의 과도기와 시간적으로 동적인 특성을 반영하는 단일 날짜 스냅샷을 제공합니다.

그림 출처: https://www.nature.com/articles/s41597-022-01307-4

Dynamic World 모드 합성(2021년 2월 - 9월)의 예입니다. 단일 픽셀(원으로 표시된 흰색 점으로 표시된 위치)에 대한 클래스 확률의 시계열과 해당 단일 날짜에 대한 Dynamic World의 예측 선택을 보여줍니다. 참고로, Dynamic World 파생 제품은 단순히 클래스 확률을 평균화하여 생성되었습니다.

 

코드 가용성(Code availability)

Dynamic World NRT 데이터셋은 "GOOGLE/DYNAMICWORLD/V1"에서 Earth Engine Image Collection으로 제공되었습니다. 이는 ee.ImageCollection('GOOGLE/DYNAMICWORLD/V1')을 사용하여 Earth Engine Python 또는 JavaScript 클라이언트 라이브러리에서 참조됩니다. Python 개발자는 geemap(https://foss4g.tistory.com/1904)을 사용하시면 편리합니다.

 

끝으로 Dynamic World는 데이터셋을 빠르게 탐색할 수 있는 공용 웹 인터페이스를 제공합니다. 공식 홈페이지(https://dynamicworld.app/)를 참고해 보시면 좋겠습니다.