OpenAI의 신규 브라우저 지원 에이전트

이 글은 AI가 번역한 기사입니다. 오역이 있을 경우 댓글로 알려 주세요.
Created on September 12|Last edited on September 12
Comment
오늘 OpenAI는 자체 브라우저를 사용해 사용자를 대신해 작업을 수행할 수 있는 새로운 AI 에이전트의 리서치 프리뷰인 Operator를 출시했습니다. 현재 미국의 Pro 이용자에게 제공되는 Operator는 온라인 작업을 독립적으로 완료하는 AI를 향한 중요한 진전입니다. 이 에이전트는 고도화된 추론, 시각적 능력, 웹 상호작용을 결합해 반복적인 디지털 워크플로를 간소화합니다.
Operator란 무엇인가?  Operator는 사용자가 하듯 웹페이지와 상호작용하는 AI 에이전트입니다. 웹 인터페이스를 탐색하고, 클릭하고, 입력하고, 스크롤할 수 있어 투어 예약, 양식 작성, 온라인 주문 같은 작업을 끝까지 수행합니다. API에 의존하는 도구와 달리 Operator는 그래픽 사용자 인터페이스(GUI)와 직접 상호작용하므로, 별도의 커스텀 통합 없이도 유연하게 웹사이트를 탐색할 수 있습니다.  
이 도구는 OpenAI의 Computer-Using Agent(CUA) 모델을 기반으로 하며, GPT-4의 비전 기능과 강화 학습을 결합해 정교한 의사결정을 가능하게 합니다. CUA의 역량 덕분에 Operator는 복잡한 워크플로에 적응하고, 오류를 스스로 수정하며, 어려움이 발생할 때 사용자와 매끄럽게 협업할 수 있습니다.  
기능과 활용 사례  Operator는 폭넓은 브라우저 기반 작업을 처리하도록 설계되었습니다. 예를 들어, 사용자는 평점이 높은 투어를 예약하거나, 양식을 작성하거나, 식료품을 재주문하도록 지시할 수 있습니다. 반복 작업을 위해 프롬프트를 저장하거나 특정 사이트에 대한 선호 설정을 지정해 워크플로를 개인화할 수도 있습니다. 동시에 여러 일을 처리하는 사용자라면, Operator는 동시 작업을 지원하므로 한 사이트에서 여행을 예약하는 동안 다른 쪽에서는 Etsy에서 쇼핑 같은 작업을 수행할 수 있습니다.  
개인용을 넘어 다양한 분야에 적용할 수 있습니다. 기업과 공공 부문 기관은 Operator를 활용해 고객 경험을 개선하고 운영을 효율화할 수 있습니다. 예를 들어, Operator는 주민이 지방정부 서비스를 쉽게 이용하도록 돕거나, 기업의 온라인 전환율을 높이는 데 기여할 수 있습니다.  
보안과 개인정보 보호 기능  보안과 개인정보 보호는 Operator 설계의 핵심입니다. 이 도구는 사용자 통제와 보안을 보장하기 위해 여러 겹의 보호 장치를 포함합니다. Operator는 로그인이나 결제 정보처럼 민감한 정보를 요구하는 상황에서는 사용자가 직접 진행하도록 요청합니다. 또한 중요한 작업을 완료하기 전에는 확인을 요구하며, 금융 거래와 같은 고위험·민감 작업은 처리하지 않습니다. 특히 민감한 사이트에서는 상호작용을 감독하는 ‘감시 모드’를 사용합니다.  
Operator에는 데이터 학습 옵트아웃 옵션, 검색 기록 삭제 도구, 적대적 웹사이트에 대한 방어 기능 등 강력한 개인정보 보호 장치도 포함되어 있습니다. 지속적인 모니터링과 인간 감독이 이러한 보호를 보강해, 다양한 환경에서도 Operator가 안전하게 작동하도록 보장합니다.  
현재 한계사항  초기 연구 프리뷰 단계인 Operator에는 여전히 과제가 있습니다. 슬라이드쇼 제작이나 캘린더 관리처럼 복잡한 워크플로는 현재 역량을 넘어설 수 있습니다. 또한 시스템은 더 정교한 GUI와 미묘한 작업을 다루는 법을 학습하는 중입니다. OpenAI는 실제 사용자 피드백과 지속적인 개선을 통해 이러한 한계를 보완할 계획입니다.  
향후 계획  OpenAI는 향후 Operator의 접근 대상을 Plus, Team, Enterprise 사용자로 확대하고, 기능을 점진적으로 ChatGPT에 통합할 계획입니다. 개발자들은 기반 CUA 모델에도 접근할 수 있게 되어, 특정 용도에 최적화된 자체 에이전트를 만들 수 있습니다. 앞으로의 업데이트는 복잡한 워크플로 관리 능력과 작업 실행 효율을 강화하는 데 중점을 둘 것입니다.  
Operator는 일상적인 디지털 작업에서 AI가 능동적으로 참여하도록 하는 초기이지만 유망한 진전입니다. 사용자 피드백을 바탕으로 발전해 가면서, 사람들이 일상에서 AI와 상호작용하고 의존하는 방식을 재정의할 잠재력을 지니고 있습니다.  
﻿
 이 기사는 AI 번역본입니다. 오역이 의심되면 댓글로 알려 주세요. 원문 기사는 아래 링크에서 확인하실 수 있습니다: 원문 보고서 보기﻿
﻿
Add a comment