요약, 감정 분석, 질의응답 등: GPT-3 프롬프트 엔지니어링을 위한 5가지 창의적인 팁
사전 학습된 GPT-3 모델을 사용해 텍스트 요약, 감정 분석 등 다양한 작업을 수행하는 방법 알아보기
이 글은 AI가 번역한 기사입니다. 오역이 있을 수 있으니 댓글로 알려주세요
Created on September 12|Last edited on September 12
Comment
소개
GPT-3는 이제 설명이 필요 없을 정도로 잘 알려져 있습니다. OpenAI가 선도한, 텍스트 생성에 가장 널리 사용되는 매우 강력한 transformer 모델이죠. 선행 모델들과 BERT 같은 다른 transformer 기반 모델들과 마찬가지로, GPT-3는 강력할 뿐 아니라 규모도 엄청납니다. 무려 1,750억 개의 파라미터를 갖추었고, 학습 비용만도 수백만 달러에 달합니다. 그리고 미세 조정이 가능하고 실제로 매우 잘 작동하지만, 약간만 창의적으로 접근하면 GPT-3는 별도의 미세 조정 없이도 놀라운 기능들을 바로 발휘할 수 있습니다.
바로 오늘 우리가 하려는 일이 그것입니다.
이 보고서의 대부분은 표준 텍스트 생성 작업이 아닌 요약이나 감정 분석과 같은 작업에 GPT-3를 활용하는 방법을 다룰 것입니다. 여기서 보게 될 내용의 대부분은 다음에서 가져온 스크린샷입니다. OpenAI의 Playground (GPT-3와 상호작용할 수 있는 UI)와 특정 프롬프트 유형입니다. 모델의 폭넓은 역량을 보여주기 위해 엔터테인먼트부터 투자, 농업, 의학, 정치에 이르는 다양한 주제를 살펴보겠습니다.
사실, 바로 그런 예시는 다음과 같습니다:

여기에서는 우리가 Playground에 입력한 프롬프트(“My thoughts on [topic], [topic], and [topic]”)와 그 결과(초록색)를 볼 수 있습니다.
이제 조금 더 창의적으로 가 볼까요?
프롬프트 1: GPT-3로 감정 분석하기
감정 분석은 특정 문구에 어떤 감정을 부여하는 작업입니다. 보통 그 감정은 긍정, 부정, 중립의 세 가지 범주로 넓게 나눕니다. 예를 ��어 모델이 “이 햄버거 정말 형편없다”라는 문구를 보면, 그것이 부정임을 이해하길 바랍니다.
이는 보통 전용 감정 분석 모델로 수행합니다. 하지만 프롬프트만 잘 설계해도, 해당 작업을 위해 학습된 전용 모델과 매우 유사한 수준으로 GPT-3에게 감정 분석을 수행하게 할 수 있다는 사실을 알고 계셨나요?

GPT-3에게 감정 분석을 시키는 프롬프트 엔지니어링 방법이 반드시 하나만 있는 것은 아니지만, 이처럼 명시적인 설명은 제게 꽤 직관적으로 느껴졌고 실제로도 상당히 잘 작동했습니다. 특히 일상적인 자연어 지시만으로도 모델의 예측을 충분히 이끌어낼 수 있다는 점이 매우 인상적입니다. 문장을 이렇게 바꿔 보면 모델이 어떻게 반응하는지 보겠습니다:


이것은 심지어 소수샷 학습 왜냐하면 이 경우에는 평이한 자연어로 된 프롬프트만 제공해 극히 적은 데이터로 모델에게 새로운 작업을 수행하도록 지시하고 있기 때문입니다.
프롬프트 2: 당신의 생각에 반대하는 GPT-3
첫 번째 예시는 제가 처음으로 GPT-3의 프롬프트 엔지니어링에 관심을 갖게 된 계기입니다. 아주 친한 친구와 이야기하던 중, 그가 다양한 투자 아이디어에 대해 GPT-3가 반박하도록 시켜서 그 아이디어들의 잠재적인 약한 고리를 더 잘 파악하고, 평가를 더 정교하게 하기 위해 활용하고 있다는 얘기를 들었습니다.
이 사례는 “생각하고 분석하는 데 도움을 주는 GPT-3” 활용 사례로 볼 수 있습니다.
주의: 프롬프트를 설계할 때, GPT-3는 공개 인터넷의 방대한 코퍼스로 학습되었다는 점을 반드시 염두에 두는 것이 중요합니다. 저는 보통 일반적인 기사라면 특정 주제를 어떻게 구성할지에 자신을 대입해 보는 방식을 선호합니다. 하지만 자유롭게 실험해 보세요. 이 단계에서는 과학인 만큼이나 예술이기도 합니다!
💡
먼저 GPT-3에 “올해 돈을 버는 가장 좋은 방법은”이라고 프롬프트를 주면, 암호화폐에 대한 의견을 생성합니다. 그다음 “하지만 나는 여기에 동의하지 않습니다. 그 이유는”이라고 ‘악마의 대변인’ 역할을 지시하는 프롬프트를 주고, 어떻게 반대 관점을 펼치기 시작하는지 살펴보겠습니다.

프롬프트에 담긴 “감정”의 정도를 가지고도 실험해 볼 수 있습니다. 다시 말해, 검은색 텍스트는 우리가 사용자로서 입력한 내용이고, 초록색은 모델의 예측 결과입니다.

요점�� 이것입니다. GPT-3는 당신의 의견과 선입견을 스트레스 테스트하는 데 도움을 줄 수 있어, 어떤 카피를 쓸지, 무엇에 투자할지, 좋은 첫 데이트란 무엇인지까지 사고방식을 새롭게 재구성하도록 도와줄 수 있습니다.

프롬프트 3: GPT-3로 텍스트 요약하기
프롬프트 엔지니어링은 GPT-3의 요약 능력을 끌어내는 데도 도움이 될 수 있습니다. 핵심 아이디어는 매우 간단합니다. 프롬프트에 다음과 같이 넣습니다. 요약하고 싶은 텍스트 한 단락 그리고 t그다음 “요약하면: ” 또는 “TL;DR” 같은 문구를 추가합니다..
예를 들어, 여기서는 긴 줄거리 요약을 가져와서 어벤져스: 엔드게임 위키백과에서…

…그다음을 OpenAI Playground에 붙여 넣고 “TL;DR” 프롬프트를 제시했습니다. 결과는 다음과 같습니다:

다음은 줄거리 설명에 대한 동일한 “TL;DR”입니다: 쇼생크 탈출.

꽤 괜찮죠?
“TL;DR” 말고도 “두어 마디로”, “요약하면”, “간단히 말해” 같은 프롬프트를 시도해 볼 수 있습니다.
프롬프트 4: GPT-3와 텍스트 생성
프롬프트가 전혀 없어도 GPT-3는 무언가를 생성하지만, 보통은 내용과 무관하거나 크게 유용하지 않습니다. 1,750억 개의 파라미터를 갖춘 GPT-3는 온갖 주제에 대해 텍스트를 생성할 수 있습니다.
여기서는 GPT-3가 어떤 주제에 대해 텍스트를 생성하길 원하는지 명확히 밝혀 주고, 다른 경우들과 마찬가지로 최대한 자연스러운 문장으로 작성하라고 말하고 싶습니다.
이건 대화 예시입니다:

이제 여기서 아래에 “B:”로 다음 프롬프트를 시작하고, 원하는 방향으로 대화를 이끌어 보세요!
목록을 만들어 달라고 요청할 수도 있습니다. 여기서 가능한 방식은 무궁무진합니다.

덧붙여 말하자면, 이 모든 예시는 GPT-3의 학습 데이터가 얼마나 방대했는지를 잘 보여 줍니다. 얼마나 많은 주제에 대해 똑똑하고 관련성 있는 문장을 만들어 내는지 보고 놀랐습니다.
프롬프트 5: GPT-3로 질문-답변하기
마찬가지로 GPT-3는 매우 다양한 주제에 대한 질문에도 꽤 탄탄하게 답합니다. 예를 들어:

다만 “시대를 초월한” 주제의 많은 질문에는 꽤 잘 답할 수 있지만, 가장 최신의 핵심 정보에 대해서는 몇 가지 함정에 빠질 수 있습니다.
예를 들어, 2022년에 미국의 현직 대통령이 누구인지에 대한 GPT-3의 답변은 다음과 같습니다:

왜 그럴까요? 이런 유형의 예측은 GPT-3만의 문제가 아닙니다. 결국 GPT-3는 검색 엔진이 아니라 트랜스포머 기반 NLP 모델이니까요. 핵심은 GPT-3처럼 거대한 모델은 수시로 재학습할 수 없고, 오늘 시점과 마지막 학습 시점 사이에 자연스러운 시차가 존재한다는 점을 이해하는 것입니다. 따라서 뉴스 기사나 시사 이슈는 이 모델의 강점이 아닙니다.
그렇다면 최신의 더 관련성 높은 정보로 질문에 답하게 하려면 어떻게 해야 할까요? 여기서도 프롬프트 엔지니어링이 도움이 됩니다.
프롬프트에 위키피디아에서 발췌한 내용을 포함해 누구에 관한 정보를 넣으면 현재 미국 대통령은 조 바이든입니다 — 이렇게 프롬프트로 넣은 텍스트와 직접적으로 관련된 질문에 GPT-3가 답하도록 할 수 있습니다.

그리고 이렇게 프롬프트에 최신의 관련 정보를 조금만 보태면, GPT-3는 이제 다음과 같은 질문에도 답할 수 있게 됩니다 아니었다 프롬프트에 포함한 정보 안에서요!

GPT-3 파인튜닝
위의 출력 결과는 모두 기본 설정의 GPT-3에서 바로 나온 것입니다. 하지만 특정 도메인에 더 적합한 결과를 원할 때는 파인튜닝이 훌륭한 선택입니다. GPT-3는 이 영역에서 매우 좋은 성능을 보이며, 때로는 수백 개 수준의 학습 데이터만으로도 충분합니다. 사실, 우리는 과거에도 이 주제에 대해 글을 쓴 바 있습니다!
- 여기 재미있는 게 있어요 만우절 블로그 글 제가 GPT-3를 파인튜닝해 기술적 머신러닝 블로그 글을 생성했던 곳이죠. 네, 바로 지금 여러분이 읽고 있는 이런 글과 똑같은 유형입니다!
결론
우리는 이미 GPT-3가 얼마나 유연한지 확인했습니다. 추가 파인튜닝 없이 프롬프트 엔지니어링 수준에서만 상호작용해도 이 모델의 강력함을 다시 한번 증명할 수 있죠. 이 블로그가 여러분이 GPT-3를 직접 사용해 보고, 프롬프트를 창의적으로 설계해 다양한 시도를 해 보도록 영감을 주길 바랍니다.
결국 때로는 그냥 물어보기만 하면 됩니다. GPT-3가 어떤 답을 내놓을지 여러분도 놀랄지 몰라요.
Add a comment