비디오: 자율주행 RC 자동차에게 교통법규를 가르치고, 그다음엔 깨뜨리기
트랙을 도는 법을 자동차에게 가르쳤다면, 다음 단계는 명확합니다. 훨씬 더 멋진 걸 하도록 가르치는 거죠.
이 글은 AI 번역본입니다. 오역이 있을 경우 댓글로 알려주세요.
Created on September 15|Last edited on September 15
Comment
지난 한 달 남짓 동안, 우리는 몇 가지를 공유했습니다 리포트 그리고 동영상 우리의 동료 Armand du Parc Locmaria의 자율주행 RC 자동차 프로젝트첫 번째 주행 모델은 일종의 ‘차선 보조’ 또는 ‘차선 중앙 유지’ 시스템이었습니다. 할 수 있는 일이라곤 트랙 위에서 항상 전진하며 이탈하지 않는 것뿐이었죠. 계속 트랙을 맴도는 건 그럴듯해 보일 수 있지만, 어딘가 시지프 같은 슬픔과 지루함이 묻어납니다. 더 흥미로운 건 도로 규칙을 철저히 지키면서도, 동시에 운전대 뒤에 현미경으로나 보일 아기 빈 디젤이 앉아 있는 듯한 과감함으로 달리도록 가르치는 일입니다.
바로 그걸 아르망이 해냈습니다.
맞습니다. 오늘 공유하는 두 개의 동영상은 자율주행 자동차가 정지 신호를 지키도록 가르치고, 그다음에는 도넛 주행을 하도록 가르치는 이야기입니다. 영상만 봐도 충분하지만, 여기에서 분위기를 더해 줄 흥미로운 포인트 몇 가지를 함께 공유하려 합니다. 먼저 정지 신호부터 시작해 보죠.
여기서 아르망의 목표는, 원래 학습에 사용했던 바로 그 트랙을 따라 차를 달리되 정지 표지에서 멈춰 도로 규칙을 따르게 하는 것이었습니다. 특히 인상적이었던 점은, 이 작업에 대해 사전 학습된 모델을 원래의 모델과 결합해 사용했다는 것입니다. 원래 모델은 트랙의 중앙을 식별하고 차가 그 방향을 계속 향하도록 하는 데 목적이 있었고, 새로 추가된 사전 학습 모델은 적절한 표지판을 감지하면 차를 정지시키는 데만 집중합니다. 실제 자율주행 차량도 이처럼 여러 개의 모델이 협력해 동작합니다.
여기서 주목할 점은 이 사전 학습 모델이 집 안에서 학습된 것이 아니라 실제 도로에서 학습되었다는 것입니다. 다시 말해, 환경이 완전히 달랐다는 뜻이죠. 다른 차량, 건물, 보행자, 수풀 등 도시 거리의 온갖 혼잡한 입력 대신, 우리가 가진 것은 소파가 놓인 거실과 마스킹 테이프로 만든 차선입니다. 게다가 정지 표지판 자체도 몇 인치 남짓한 크기였습니다.
그런데 바로 작동했습니다! 예상과 달리 아르망은 그 사전 학습 모델을 파인튜닝할 필요가 없었습니다. 원래의 주행 모델과 통합하기만 하면 되었죠.
훨씬 더 어렵고, 뭐라 해도 더 메탈한 도전은 이 자동차로 도넛 주행을 해내게 만드는 일이었습니다.
영상에서는 그가 문제에 접근한 방식과, 이를 구축하고 테스트하는 과정을 다룹니다. OpenAI Gym 환경 자동차를 위해 실제로 가치 있었던 지표가 무엇이었는지, W&B가 어떻게 도움이 되었는지, 그리고 그 밖의 많은 내용까지.
그런데 여기서 흥미로운 점은, 그냥 원을 그리며 도는 주행(심심함)과 도넛 주행(짜릿함) 사이에 분명한 차이가 있다는 것입니다. 아르망은 그 차이가 무엇인지, 그리고 W&B에서 보상과 행동을 관찰해 상관관계를 분석함으로써 도넛 주행을 위한 신경망의 전략을 어떻게 파악했는지에 대해 이야기합니다. 게다가 부담 거의 없는 소규모 차량 충돌 장면도 몇 번 볼 수 있는데, 이것도 나쁘지 않죠.
그가 자동차를 어떻게 디버깅했는지, 그리고 W&B가 프로젝트에 어떻게 도움이 되었는지 보고 싶다면 다음을 확인해 보시길 권합니다. 이 보고서그리고 여러분이 진행 중인 재미있는 프로젝트 중에 우리가 소개하면 좋을 것 같다고 생각되는 것이 있다면, 아래에 댓글을 남기거나 justin.tenuto@wandb.com 으로 이메일을 보내주세요. 이런 멋진 프로젝트를 더 많이 커뮤니티와 함께 나누고 싶습니다.
프로젝트 더 자세히 보기
Add a comment