노센스와 함께하는 데이터 분석

데이터과학자, '현장에서 바로 써먹는' 시리즈 저자

이슈

OpenAI의 ChatGPT-4 공개

노센스 2023. 3. 21. 22:53

서비스(GPT-3.5) 실시 후 단 5일만에 100만명의 사용자를 끌어낸 ChatGPT 열풍이 가시지 않고 있습니다.

 

그리고 불과 몇 일 전인 2023.03.15. GPT-4의 기술을 공개했고, ChatGPT Plus 요금제($20/month)를 통해 미리 사용해볼 수 있는 기회를 제공하고 있습니다.

 

OpenAI 측에서 공개한 GPT-4 Technical Report에 따르면

 

GPT-4는 아래 그림과 같이 다양한 시험에서 매우 우수한 성적을 거뒀습니다.

 

특히 미국 통합 변호사 시험(Uniform Bar Exam)에서 3.5의 경우 하위 10% 수준이었지만 4의 경우 상위 10%를 차지할 정도로 높은 성능 변화를 나타내고 있습니다.

그리고 체감이 컸던 한국어 질의 응답의 수준이 3.5 대비 크게 향상되었습니다. 비록 3.5에서의 한국어 정확도가 언급되지 않아 어느 정도 향상되었는지는 모르겠지만 3.5의 영어 정확도가 70.1% 수준이었다니 GPT-4의 한국어 정확도 77%는 매우 높은 수준입니다.

ChatGPT-4에서 3.5 대비 개선된 부분은 다양한 언어의 정확도 향상 외에도 창의력(Creativity), 이미지 입력(Visual Input), 길어진 텍스트(Longer Context)를 강조하고 있습니다.

특히 이미지 입력 부분은 기존에 텍스트 입력만 가능한 상황에서 이미지까지 입력 가능한 멀티 모달(Multi Modal) 기능을 제공해서 큰 충격을 줬습니다. 아래는 인터넷의 웃긴 사진 중 하나로 ChatGPT-4에 텍스트로 "이 사진이 왜 웃긴지 그리고 패널별로 설명해달라"는 내용과 아래 이미지를 함께 첨부했을 때 GPT의 결과를 함께 나타냈습니다.

참고로 이 사진이 웃긴 이유는 아이폰의 충전단자는 라이트닝 케이블인데 그 형태가 VGA 단자 모양인게 적절하지 못해서 웃긴 것입니다.

 

GPT-4는 이러한 내용을 사진만 보고 정확히 인식해 패널별 내용을 기술하고, 마지막에는 왜 이 사진이 웃긴지까지 정확히 설명했습니다.

 

매우 놀라울 따름입니다.

 

그리고 (입력 및 출력)텍스트의 경우 기존 대비 8배 이상 증가해 영어기준 3천 단어 수준에서 2.5만 단어 수준으로 크게 향상되었습니다.

 

GPT-4는 Plus 요금제($20/month)를 통해 이용할 수 있고, 필자의 경우에도 해당 요금제를 사용하고 있습니다.

아래 그림과 같이 Plus 요금제를 이용하게 되면 Model을 선택할 수 있는 기회를 줍니다. GPT-3.5와 4를 모두 선택할 수 있습니다. 다만 GPT-4 모델의 경우 기술 리포트에서 공개한 이미지 입력이나 긴 텍스트는 아직 적용되지 않았습니다.

ChatGPT로 부터 양질의 답변을 얻기 위해서는 질문을 최대한 구체적으로 작성하는게 좋습니다. 그리고 ChatGPT를 이용하면 간단한 보고서 초안 생성에서 표로 요약하는 작업 부터 노래 작사, 글쓰기 등의 창의적인 작업까지 가능합니다.

 

개인적으로 가장 큰 충격은 각종 프로그래밍 코드를 작성해달라고 하면 작성해주는 기능으로 이제는 google 검색보다 ChatGPT를 더 애용할 것 같습니다.

 

앞으로는 어떤 지식을 습득하는 것보다 ChatGPT에 어떻게 질문해야 원하는 답변을 얻을 수 있는지를 학습하는게 더 중요해질 것으로 생각됩니다.

 

GPT-4는 Microsoft의 Copilot을 통해  PPT 및 엑셀 작업을 혁신적으로 변화시킬 것으로 생각됩니다.

 

마지막으로 GPT-3, GPT-3.5와 GPT-4를 비교한 내용을 표로 정리해보았습니다.

 

모델명 출시시기 파라미터 수 특징
GPT-4 2023년
(plus 요금제로 선공개)
미공개 ㅇ입력 : 텍스트 + 이미지
ㅇ출력 : 텍스트, 표, 코드
ㅇ입ㆍ출력 텍스트길이 : 2.5만 단어(영문기준)
창의력 향상, 영어 외 언어 정확도 향상
GPT-3.5 2022년 1,750억 개 ㅇ입력 : 텍스트
ㅇ출력 : 텍스트, 표, 코드
ㅇ입ㆍ출력 텍스트길이 : 3천 단어(영문기준)
RLHF(Reinforcement Learning from Human Feedback) 적용으로 답변 정확도와 안정성이 급상승해 단 기간에 큰 인기를 얻음
GPT-3 2020년 1,750억 개 ㅇ입력 : 텍스트 + 이미지
ㅇ출력 : 텍스트, 표, 코드
ㅇ다소 어색한 답변

 

'이슈' 카테고리의 다른 글

ChatGPT의 파라미터 수 의미  (0) 2023.03.22