For more information or if you need help retrieving your data, please contact Weights & Biases Customer Support at support@wandb.com
김소윤 (네이버 클라우드, Foundation Research, AudioLLM Mission Leader)
음성 인식 팀에서 커리어를 시작한 이후, 다양한 서비스 환경에서 동작하는 음성 AI 모델을 개발해온 엔지니어입니다. 현재는 Naver Cloud의 AudioLLM Mission Team에서 오디오와 대규모 언어 모델(LLM)을 결합한 AudioLLM 기술을 연구하고 있습니다.
[강연 내용] “이 음성을 부산 사투리로 바꿔주세요” – AudioLLM 기반 음성 스타일 변환 개발기
Naver Cloud에서 진행한 음성 스타일 변환 프로젝트에서 AudioLLM 기술을 실제 애플리케이션 형태로 구현해본 과정을 공유합니다. 사투리 변환과 음성 통역을 사례로, AudioLLM을 활용한 음성 스타일 변환이 어디까지 가능했는지와 함께, 구현 과정에서 마주한 한계와 시행착오를 살펴봅니다. 또한 이러한 경험을 바탕으로, 현재 AudioLLM 연구가 직면하고 있는 기술적 과제들과 이를 어떻게 풀어가고 있는지도 함께 이야기하고자 합니다.
이분도 (한글과컴퓨터, AI Agent Engineer)
한글과컴퓨터에서 오픈데이터로더 오픈소스를 개발하고 있습니다.
개발, 운영, 이슈처리, 의사소통 등 모든 분야에 Agent를 도입하는 데 가장 많은 노력을 쏟고 있습니다.
[강연 내용] 회사 안팎에서 AI Agent를 활용하면서 겪은 성공과 실패 이야기
ElevenLabs를 활용해서 3시간 만에 Skillthon 우승한 경험과, GitHub 이슈 자동화 Agent를 한 달 운영하며 마주한 현실적인 문제들. 왜 하나는 빠르게 성공하고 하나는 어려웠는지, 그 차이에서 배운 것들을 공유합니다.

