ChatGPT, OpenAI의 최신 AI 모델, 지능적인 대화를 지원 — 프리뷰에서 무료로 사용 가능
OpenAI는 대화에 최적화된 새로운 GPT 계열 모델인 ChatGPT를 공개했으며, 현재 리서치 프리뷰 기간 동안 무료로 사용할 수 있습니다. 이 글은 AI 번역 기사입니다. 오역이 있을 경우 댓글로 알려 주세요.
Created on September 15|Last edited on September 15
Comment
오늘 OpenAI는 GPT 계열에 새롭게 추가된 모델을 공개했습니다. ChatGPT현재 리서치 프리뷰 단계에 있습니다. 이 모델은 사용자와의 대화에 특화되어 설계되었으며, 지시나 프롬프트를 따라 자세한 응답을 제공합니다. 다행히도 현재는 무료로 사용 가능 프리뷰 기간 동안
ChatGPT의 작동 원리
ChatGPT는 기반으로 합니다 InstructGPTOpenAI가 거의 1년 전인 1월에 공개한 모델로, 기본 GPT-3보다 지시를 더 잘 따르도록 설계되었습니다. ChatGPT는 단일 프롬프트에 응답하는 데 더 초점을 둔 InstructGPT와 달리, 지속적인 대화를 훨씬 더 잘 수행한다는 점에서 차별화됩니다.
- 첫 번째 단계는 인간 데이터를 수집하는 것입니다. ChatGPT의 경우 두 참가자 간의 대화로, 한쪽은 사용자 역할을 하고 다른 한쪽은 AI 어시스턴트 역할을 맡습니다. 실제 AI 모델의 응답을 참고하여 사람의 응답 구성이 이뤄졌습니다. 이렇게 수집한 데이터는 GPT-3.5 모델을 미세 조정하는 데 사용됩니다.
- 다음 단계에서는 미세 조정된 모델이 주어진 프롬프트에 대해 여러 개의 출력을 생성하고, 사람이 각 응답을 최상부터 최하까지 순위를 매깁니다. 이렇게 얻은 순위 데이터는 보상 모델을 학습하는 데 사용되며, 이 보상 모델이 최종 학습 단계를 자동화합니다.
- 최종 단계에서는 GPT-3.5 모델(ChatGPT)을 추가로 미세 조정하며, Proximal Policy OptimizationOpenAI가 사용한 표준 강화 학습 알고리즘인 PPO.

ChatGPT의 한계
ChatGPT는 질문이나 의견에 길고 자세한 답변을 제공합니다. 그러나 여전히 NLP 모델 전반에 공통적인 많은 한계가 있습니다.
다른 NLP 모델과 마찬가지로 ChatGPT는 유해하거나 부정확하고 해로운 내용을 생성할 수 있습니다. 지식 범위는 학습 데이터에 한정되어 있으며, 어떤 절대적 사실 권위에도 의존하지 않습니다. 문제를 피하기 위해 민감하거나 어려운 주제를 피하려고 노력하지만, 그럼에도 불구하고 문제가 발생할 수 있습니다. 이러한 이유로 ChatGPT의 출력은 OpenAI의 Moderation API에 의해 제한됩니다.
ChatGPT의 문체는 학습 데이터의 영향을 받으며, 전반적으로 장황한 답변을 작성하는 경향이 있습니다. 특정 표현을 자주 반복하거나 재사용하기도 합니다. 모호한 표현이 주어지면 의미를 추측할 뿐, 명확히 하기 위한 추가 질문은 하지 않습니다.

���접 ChatGPT 사용하기
연구 프리뷰 기간 동안에는 OpenAI 계정이 있는 누구나 ChatGPT를 무료로 사용할 수 있습니다. 사용자는 응답에 대해 피드백을 제공할 수 있으며, 이는 ChatGPT의 개선 방향을 잡는 데 도움이 됩니다.
아케이드 레이싱 비디오 게임을 만드는 주제로 내가 ChatGPT와 나눴던 대화입니다:

Add a comment