Skip to main content

버클리 딥드라이브(BDD110K) 데이터셋

BDD100K 데이터셋은 자율주행을 위한 10가지 인지 과제에 대해 주석이 달린 100,000개의 주행 동영상을 포함한, 가장 크고 다양한 주행 영상 데이터셋입니다. 이 글은 AI 번역본입니다. 오역이 있을 수 있으니 댓글로 알려 주세요.
Created on September 12|Last edited on September 12

BDD100K 데이터셋이란?

BDD100K 데이터셋 (B버클리 이프 는 10가지 자율주행 인지 과제에 맞춰 주석이 달린 100,000개의 주행 영상을 포함한, 가장 크고 다양한 주행 비디오 데이터셋입니다. 이 과제에는 도로 객체 탐지와 차선 탐지가 포함됩니다.
이 크라우드소싱 데이터셋은 도시 도로, 주거 지역, 고속도로 등 다양한 장면 유형을 포함한 고해상도 이미지와 GPS/IMU 데이터를 제공하며, 하루 중 서로 다른 시간대에 기록된 다양한 날씨 조건을 포함합니다.
각 비디오의 10초 지점 프레임에는 이미지 기반 과제를 위한 주석이 달려 있으며, 전체 시퀀스는 추적 과제에 사용됩니다. BDD100K는 현실적인 주행 시나리오를 포괄하고, 공개된 관심 범주의 외형 변이와 포즈 구성에서 이른바 롱테일에 해당하는 경우까지 더 폭넓게 포착합니다. 확장 가능한 주석 형식.
시작하기 전에, 다음 내용을 다룰 예정입니다:

BDD100K에서 다루는 내용



BDD100K 데이터셋 일반 정보

데이터세트 구조(클릭하여 확장)

BDD100K 데이터세트가 지원하는 작업

BDD100K 데이터세트가 지원하는 작업을 간단히 정리하면 다음과 같습니다.

이미지 태깅

BDD100K 데이터세트는 제공합니다 이미지 수준 주석 여섯 가지 기상 조건, 여섯 가지 장면 유형, 그리고 하루 중 세 가지 서로 다른 시간대에 대해 구성되어 있습니다. 눈이나 비와 같은 극한 기상 조건에 대한 주석도 대량으로 포함되어 있습니다. 또한 데이터세트에는 주간과 야간 비디오 주석이 대체로 비슷한 수량으로 포함되어 있습니다.
조금 더 세분해서 보면, 이 데이터세트에는 다음이 포함됩니다:
  • 날씨: 맑음, 흐림, 눈, 비, 안개, 부분적으로 흐림, 미정
  • 장면: 터널, 주거 지역, 주차장, 도시 거리, 주유소, 고속도로, 미정
  • 하루 시간대: 주간, 야간, 새벽/황혼, 미정



차선 감지

차선 감지는 카메라로 도로 위의 차선을 탐지하는 작업입니다. 이는 차선 기반 내비게이션이나 고정밀(HD) 지도 모델링 등 자율주행의 많은 요소에 필수적입니다.
BDD100K 데이터세트의 풍부한 주석은 다음의 세 가지 하위 과제를 위해 차선 레이블을 제공합니다:

차선 범주

0: crosswalk
1: double other
2: double white
3: double yellow
4: road curb
5: single other
6: single white
7: single yellow
8: background

차선 방향

0: parallel
1: vertical
2: background

차선 스타일

0: solid
1: dashed
2: background

주행 가능 영역 분할

차선 수준 주석 외에도 BDD100K 데이터세트는 주행 가능 영역 분할 작업을 위해서도 구성되어 있습니다. 구체적으로, 데이터세트에는 두 가지 서로 다른 범주에 대한 주석이 포함되어 있습니다.
  • 직접 주행 가능 영역: 직접 주행 가능 영역은 운전자가 현재 주행하고 있는 구역을 의미합니다. 또한 운전자가 다른 차량보다 통행 우선권, 즉 진행 권한을 갖는 구역을 가리킵니다.
  • 대체 주행 가능 영역: 대체 주행 가능 영역은 현재 주행 중이진 않지만 차선 변경을 통해 주행할 수 있는 구역을 의미합니다.
직접 주행 가능 영역과 대체 주행 가능 영역은 겉으로 보기에는 구분하기 어렵지만, 기능적으로는 서로 다르므로 알고리즘이 차단 물체와 장면 맥락을 인식할 수 있어야 합니다.

도로 객체 감지

영상의 10초 지점 프레임에는 자율주행 분야에서 흔히 등장하는 10개 객체에 대한 바운딩 박스 주석이 달려 있습니다. 이에 따라 다음과 같은 2D 객체 주석을 갖춘 100K장의 이미지가 제공됩니다.
1: pedestrian
2: rider
3: car
4: truck
5: bus
6: train
7: motorcycle
8: bicycle
9: traffic light
10: traffic sign

의미론적 분할

이미지 분할에서는 한 이미지가 두 가지 주요 구성 요소로 이루어져 있습니다: 사물재질.
사물 이미지에서 셀 수 있는 객체(예: 사람, 꽃, 새, 동물 등)에 해당하며, 재질 유사한 질감을 가진 셀 수 없는 영역(또는 반복 패턴)을 나타냅니다(예: 도로, 하늘, 잔디).
픽셀 수준 시맨틱 세그먼트 에 대한 주석 재질 데이터셋의 1만 장 이미지에 대해 제공됩니다. 다만 과거의 사정으로 인해 모든 이미지에 해당하는 비디오가 존재하지 않으므로, 상당한 중복은 있지만 10만 장 이미지의 진부분집합은 아닙니다.
0: road
1: sidewalk
2: building
3: wall
4: fence
5: pole
6: traffic light
7: traffic sign
8: vegetation
9: terrain
10: sky
11: person
12: rider
13: car
14: truck
15: bus
16: train
17: motorcycle
18: bicycle

파노픽 세그멘테이션

같은 1만 장의 이미지에는 장면의 각 픽셀에 시맨틱 라벨과 고유한 인스턴스 식별자가 부여된 통합 이미지 분할 주석도 포함되어 있습니다. 겹치는 주석 간의 불일치는 객체 인스턴스를 우선시하여 해결하며, 우선순위는 각 사물 ~보다 ~보다는 물질.
데이터셋에는 다음과 같은 다양한 파노픽 세그멘테이션 주석이 제공됩니다. 레이블 0–30은 나타냅니다 재질 반면 31–40은 나타냅니다 사물.
0: unlabeled
1: dynamic
2: ego vehicle
3: ground
4: static
5: parking
6: rail track
7: road
8: sidewalk
9: bridge
10: building
11: fence
12: garage
13: guard rail
14: tunnel
15: wall
16: banner
17: billboard
18: lane divider
19: parking sign
20: pole
21: polegroup
22: street light
23: traffic cone
24: traffic device
25: traffic light
26: traffic sign
27: traffic sign frame
28: terrain
29: vegetation
30: sky
31: person
32: rider
33: bicycle
34: bus
35: car
36: caravan
37: motorcycle
38: trailer
39: train
40: truck

다중 객체 추적

동영상에서 객체 간의 시간적 연관을 이해할 수 있도록 BDD100K 데이터셋에는 약 40만 프레임으로 구성된 2,000개의 동영상이 포함되어 있습니다. 각 동영상은 약 40초 길이이며 5 fps로 주석이 달려 동영상당 약 200프레임이 생성됩니다. 객체 감지 작업의 처음 8개 클래스에 대해 130.6K개의 트랙 아이덴티티와 3.3M개의 바운딩 박스가 주석으로 제공됩니다.
이 데이터셋은 복잡한 가림 및 재등장 패턴을 보이며, 총 49,418건 이상의 가림 현상이 관측되었습니다. 이는 트랙 3.51개당 가림이 한 번 발생하는 빈도에 해당합니다.

다중 객체 추적 및 분할

자율주행 차량 개발에서 MOTS는 혼잡한 장면에서 여러 객체를 분할하고 추적하는 것을 목표로 합니다. 90개의 동영상에 대해 1만 4천여 프레임과 12만 9천여 개의 주석이 풍부하고 촘촘하게 제공됩니다. 객체 추적 과제와 동일한 8개 클래스에 주석이 달려 있습니다.

포즈 추정

BDD100K 데이터셋의 사람과 보행자에는 포즈 추정과 검출을 돕기 위해 18개 키포인트 주석이 제공됩니다. 전체 10만 개 샘플 프레임 중 약 1만 개 프레임에 관절 키포인트 주석이 포함되어 있습니다.

0: head
1: neck
2: right_shoulder
3: right_elbow
4: right_wrist
5: left_shoulder
6: left_elbow
7: left_wrist
8: right_hip
9: right_knee
10: right_ankle
11: left_hip
12: left_knee
13: left_ankle
14: right_hand
15: left_hand
16: right_foot
17: left_foot


추천 읽을거리



이 글은 AI로 번역되었습니다. 오역이 의심되는 부분이 있다면 댓글로 알려 주세요. 원문 보고서는 아래 링크에서 확인할 수 있습니다: 원문 보고서 보기