ICLR 2020의 Drought Watch: 지구를 위한 협업형 딥러닝의 첫걸음
영향력 있는 딥러닝을 위한 우리의 협업형 벤치마크
이 글은 AI 번역본입니다. 오역이 의심되면 댓글로 알려주세요.
Created on September 15|Last edited on September 15
Comment
요약 — 영향력 있는 딥러닝을 위한 우리의 협업형 벤치마크가 탄력을 받고 있으며 ICLR 2020에서 발표됩니다. 협업에 함께하세요. 여기, 읽어보기 논문, 또는 확인해 보세요 다가오는 발표.
ICLR에서의 Drought Watch
위성 이미지의 품질과 가용성은 빠르게 개선되고 있지만, 이미지를 해석하는 일은 여전히 어렵습니다. 전문가들은 위성 이미지에서 가뭄 징후를 식별할 수 있지만, 이 과정은 느리고 비용이 많이 들며, 지상에서 반복적으로 데이터를 수집하고 라벨링하는 작업도 마찬가지입니다. 기존 시스템은 가뭄을 안정적으로 예측하지 못합니다. 예를 들어, 식용 식물과 먹을 수 없는 선인장을 구분하지 못하는데, 이는 초식 동물의 채식 가능성에 큰 차이를 만듭니다. 이 과제에서 더 높은 정확도는 곧바로 케냐 북부 가정에 대한 금융 지원을 향상시킵니다 기존 보험 프로그램을 통해서입니다. 우리는 이 프로젝트가 연구자들이 위성을 활용해 가뭄과 기타 농업 요인을 더 잘 측정하는 방법을 함께 개선하고, 환경 지속 가능성이라는 의미 있는 과제에 딥러닝을 적용하도록 영감을 주길 바랍니다.

Weights & Biases Benchmarks 딥러닝 프로젝트에서 개방적이고 효율적인 협업을 가능하게 하는 중앙화된 대화형 시각화 플랫폼입니다. Drought Watch 이러한 프로젝트 중 하나로, 위성 기반 가뭄 탐지를 위한 벤치마크입니다. UC Davis의 Andrew Hobbs와 다수의 협력자들의 지원으로 진행된 최신 버전의 연구 [1]가 다음에 채택되었습니다 국제 학습 표현 학회(ICLR) 2020 의 일환으로 농업을 위한 컴퓨터 비전 워크샵. 당신은 할 수 있습니다 ArXiv에서 논문을 읽어보세요 또는 라이브 스트리밍을 시청하고 4월 26일 일요일 오전 11시 PST에 토론에 참여하세요.
이 연구는 위성 데이터만으로도 컴퓨터 비전이 농업 환경과 작황 등 농업 관련 지표에 대한 예측을 향상시킬 수 있음을 보여줍니다. 기후 위기가 심화되는 상황에서, 이러한 예측의 정확성과 효율성은 점점 더 중요해지고 있습니다. 또한, 커뮤니티 벤치마크가 분산 협업을 촉진하여 실질적이고 긍정적인 영향을 주는 의미 있는 문제를 해결하도록 이끈다는 첫 번째 증거이기도 합니다. 우리는 환경 지속가능성, 신체 건강, 사회적 선과 같은 지구의 당면 과제에 초점을 맞춰, 이와 같은 협업을 더 많이 이끌고 지원하기를 희망합니다.
지금까지의 벤치마크 진행 상황
2019년 8월에 우리는 벤치마크를 출시했습니다 기준 정확도는 75.8%입니다. 우리가 시작점으로 제시한 모델은 의도적으로 단순한 합성곱 신경망으로, 층 크기, 학습률, 기타 하이퍼파라미터를 쉽게 설정할 수 있어 참가자들이 다양한 모델 변형을 탐색하도록 유도합니다. 이 베이스라인을 공개하기 전에 우리는 하이퍼파라미터를 짧게만 탐색했습니다. 저자 팀을 제외하고 9명의 참가자가 W&B의 Drought Watch Benchmark에 합류했으며, 이들의 프로젝트에서 2,500건이 넘는 실험 실행이 기록되었습니다. 비지도 클러스터링과 ResNet을 시도하기도 했고, 그리고 현재까지 기록한 최고 검증 정확도 사용자 ubamba98가 EfficientNet 아키텍처를 사용해 달성한 77.8%이며, 이는 다음에서 나온 결과입니다 2019년 Tan & Le모든 제출 모델은 케냐의 지수 보험[2]에서 현재 사용 중인 모델보다 우수하며, 해당 모델은 위성 이미지로 구성된 벤치마크 검증 세트에서 67%에 그칩니다.

오픈 프로젝트에 대한 이런 수준의 참여와 검증 정확도가 크라우드소싱으로 10% 향상된 점은 매우 고무적이며, 이제 막 시작 단계입니다. 단순한 베이스라인과 더 정교한 모델 간의 성능 차이가 몇 퍼센트포인트에 불과하므로, 추가 개선의 기회가 분명히 존재합니다. 저자들은 다양한 네트워크 아키텍처를 계속 탐색할 계획입니다. ���이터 처리 측면에서는 스펙트럼 밴드를 더 세분화해 분석하려고 합니다(현재 일부 밴드는 신호보다 잡음을 더 많이 추가합니다). 또한 구름으로 가려진 이미지를 걸러내고, 증강 전략을 탐색할 예정이며, 특히 현재 라벨이 없는 오프센터 픽셀을 클러스터링 등으로 활용하는 방법을 모색하겠습니다. 이와 함께 클래스 불균형을 보정하기 위한 다양한 기법도 시도하고자 합니다. 대략 60%의 데이터가 가뭄을 나타내는 클래스 0에 속하기 때문입니다. 진행 중인 벤치마크가 이러한 개선을 뒷받침하고 상호 보완하도록 돕기를 바랍니다.
이 연구가 중요한 이유
구체적으로, Drought Watch 데이터세트는 10만 장이 넘는 전문가 라벨의 지상 지리참조 사진을 동일한 지리 좌표를 중심으로 한 위성 이미지와 짝지었습니다. 이 접근 방식은 위성 이미지에 가뭄 상태[3]에 대한 지도 학습용 라벨을 부여하며, 일반화 가능성이 매우 높습니다. 농업 성과에 관한 지상 데이터(예: 작물 수확량, 질병 상태)가 있는 경우라면 어디서든 이 방법을 활용해 위성 기반 지수를 구축할 수 있습니다. 나아가 국가나 지수 간(예: 연관 작물의 수확량) 모델 앙상블 또는 전이 학습을 가능하게 하여, 모델의 견고성을 높이고 새로운 지도 라벨에 대한 필요를 줄일 수 있습니다. 이러한 모델은 위성 데이터를 지상에서 수집한 수확량, 사료 품질 또는 기타 지표에 대한 시의적절한 정보로 유연하게 매핑함으로써 농업·축산 분야의 실제 응용에 도움을 줄 수 있습니다.
머신러닝 기반의 더 정확한 지수는 지수 보험 프로그램의 효과를 향상시킬 수 있습니다[2]. Drought Watch는 컴퓨터 비전 기법이 기존 원격 탐사 기법을 능가할 수 있음을 보여줍니다. Drought Watch의 궁극적인 목표는 실제 세계에서 지수 보험을 개선하는 것입니다. 우리는 현재 우리 모델을 바탕으로 한 보험 상품을 개발 중이며, 올해 말 현장 테스트를 진행하기를 기대하고 있습니다. 한 번 학습해 배포하면, 위성 기반 컴퓨터 비전 모델은 필요할 때마다 상황을 평가할 수 있어 더 자주 모니터링하고 가입자에게 더 신속히 보상할 수 있습니다. 보험 지급의 정확도와 속도를 모두 높임으로써, 이는 농가에 대한 보험의 실질적 효익을 크게 증대시킬 수 있습니다. 이 프로그램에서 긍정적인 결과가 나온다면, 다른 국가 및 다른 농업·환경 의사결정 맥락에서도 유사한 프로그램의 도입을 촉진할 수 있습니다. 더 일반적으로, 딥러닝을 활용해 보험 모델을 개선하는 전략은 다음과 같은 많은 중요한 분야에도 유용할 수 있습니다. 산불 위험 관리하기
Drought Watch에서의 참여와 모델 개선 성과를 바탕으로, CodeSearchNet, 그리고 기타 초기 벤치마크, 우리는 벤치마크가 분산 협업을 촉진한다는 초기 근거를 확인했습니다. Benchmarks의 진정한 가치는, 크라우드소싱된 딥러닝 해법이 배포된 뒤 의미 있는 제품으로 장기적인 임팩트를 내는지로 평가될 것입니다. 특히 팬데믹과 기후 위기의 시기에는 이러한 해법을 더 빠르게, 더 많은 사람들이 함께 만들어 가야 합니다. 모델 구축 과정이 더욱 포용적이고 협업적으로 변할수록, 우리는 더 다양한 역량과 관점을 활용해 더 나은—더 정확하고, 더 일반화 가능하며, 더 설명 가능하고, 더 공정하고, 더 효율적이며, 더 안전한—모델을 만들 수 있고, 이는 지구에 더 나은 결과로 이어집니다. 여러분의 참여 없이는 불가능합니다.
당신이 도울 수 있는 방법
이 내용에 공감하신다면, 꼭 함께 협업하고 싶습니다:
- 벤치마크에 참여하기: 의미 있는 프로젝트에 기여하면서 딥러닝 역량을 키우고 최첨단 성능을 발전시키세요
- Drought Watch와 관련된 데이터셋이나 방법을 제안해주세요. 위성 이미지나 농업 데이터로 작업하시는 분들—특히 옥수수, 벼, 카사바 등의 주요 작물 수확량에 대한 지리참조 데이터가 있다면—Andrew(awhobbs@ucdavis.edu)에게 연락 부탁드립니다.
- 새로운 벤치마크를 시작하세요: 미션과 맞는 프로젝트—특히 환경 지속가능성, 건강, 사회 공익, AI 안전 분야—를 진행 중이고 더 많은 협업자나 딥러닝 접근법이 도움이 될 수 있다면 Stacey(stacey@wandb.com)에게 연락해 주세요.
- 커뮤니티를 키우기: 이러한 노력의 최신 소식과 계속되는 참여 기회를 받아보려면 Slack에서 W&B 포럼에 참여하기 또는 메일링 리스트에 가입하세요(이 페이지 하단의 양식을 이용).
지구의 날 50주년을 맞아 온 마음으로 희망을 담아
Stacey
— 인용 및 주석 —
[1] 본 연구에 사용된 데이터는 International Livestock Research Institute, Cornell University, UC San Diego 간의 연구 협력을 통해 수집되었습니다. 이 연구는 Atkinson Centre for a Sustainable Future의 Academic Venture Fund, AusAID Development Research Awards Scheme Agreement No. 66138을 통한 Australian Aid, National Science Foundation(0832782, 1059284, 1522054), 그리고 ARO grant W911-NF-14-1-0498의 지원을 받았습니다. 또한 훌륭한 협력자 Nathan Jensen, Jin Baek, 그리고 Weights & Biases 팀 전체에게 감사드립니다.
[2] 지수 보험은 어떻게 작동할까? 농업 지수 보험은 강수량, 면적당 평균 수확량, 식생 성장과 같은 공통 지표를 사용해 작물 또는 가축 생산을 통계적으로 모델링하며, 정확도와 계산 비용은 지표에 따라 달라진다. 강수량이나 위성으로 관측한 가뭄 상태처럼 원격으로 측정 가능한 지표는 계산 비용이 낮다. 추가적인 현장 측정 없이도 다양한 후처리 기법을 통해 예측 정확도를 높일 수 있기 때문이다. 공통되고 외부적이며 최대한 객관적인 지표에 의존함으로써, 지수 보험은 일반 보험의 두 가지 핵심 문제(높은 비용을 제외하고)를 피할 수 있다. 역선택(손실을 볼 가능성이 큰 사람들만 보험에 가입하는 현상)과 도덕적 해이(보험금을 받기 위해 비생산적인 행동을 하는 현상)이다. 이렇게 남는 주요 비용이 바로 기준 위험이다. 즉, 지수의 추정치와 개별 농가의 실제 손실 간 오차를 말한다. 가뭄 같은 농업 조건을 나타내는 지수가 원격 탐사, 위성 영상, 그리고 이제 컴퓨터 비전과 딥러닝 등 기술 발전으로 더 정확해질수록 기준 위험은 줄어들고, 프로그램 비용이 낮아지며 더 많은 농가가 접근할 수 있게 된다. 지수 보험 프로그램의 효과성을 측정하기 위해 경제학자들은 최소 품질 기준을 고려한다. 이는 소득 안정화 가능성 측면에서, 시간이 지남에 따라 보험이 전혀 없는 경우와 동일한 규모의 직접 현금 이전과 비교해 프로그램의 가치를 평가하는 방법이다. 또한 보장에 대한 확신을 바탕으로 목축민이 미래 생산성에 더 많이 투자하게 되는 “사전(ex-ante) 효과”도 함께 연구한다. 자세한 내용은 여기에서 확인할 수 있습니다.
[3] 보다 정확히 말하면, 현장에서 활동하는 케냐의 숙련된 목축민들이 “이 지점에서 소를 몇 마리나 먹일 수 있는가?”라는 질문에 0, 1, 2, 또는 3+로 답하며 사료 품질에 대한 라벨을 매기고, 이렇게 생성된 값이 학습 데이터의 라벨로 사용됩니다.
Add a comment