d라이브러리









 

뉴스에서도 챗GPT, 유튜브에서도 챗GPT, 챗GPT가 연일 화제입니다. 

챗GPT에 관한 여러 가지 소문이 많지만, 챗GPT의 원리는 무엇인지, 유료 버전과 무료 버전은 어떻게 다른지 등에 대한 궁금증을 정확히 해결하기는 쉽지 않습니다. 챗GPT에 관한 확실한 정보, 9문 9답을 통해 확인하세요!

 

Q. 챗GPT가 뭔가요?

 

오픈AI가 개발한 초대형 언어 모형인 GPT 시리즈를 기반으로 한 고성능 챗봇이에요. GPT는 ‘Generative Pre-trained Transformer’의 약자로, 기계학습의 한 방법인 ‘★트랜스포머’에 기반해서 많은 양의 텍스트 데이터로 사전 훈련을 거친 후 특정 작업을 수행하게 만든 모형이에요. 2018년 GPT-1이 처음 출시되고, 2019년에는 GPT-2, 2020년에는 GPT-3가 나왔어요. 2022년 11월 30일에 출시된 챗GPT는 GPT-3를 미세조정한 GPT-3.5에 대화형 사용자 인터페이스를 접목해서 우리가 어떤 질문을 했을 때 적절한 답변을 주는 형태로 만들어졌어요.

 

Q. 기존 챗봇과 다른 점은요?

 

먼저 성능이 눈에 띄게 좋아졌어요. 대화형 언어 모형은 기존에도 꾸준히 연구됐고, 수도 없이 많이 개발돼 있어요. 우리나라에는 대표적으로 심심이나 이루다 같은 챗봇이 있었지요. 하지만 챗GPT만큼 인간 수준으로 대화가 가능한 모형은 처음이에요.

 

다양한 연령대가 활용할 만큼 사용성도 크게 개선됐어요. GPT-3만 해도 개발자와 연구자들이 주로 사용했어요. 하지만 챗GPT는 대화형 작업에 최적화돼서 일반인도 쉽게 이용할 수 있어요. 또 이전에는 필요에 따라 각각에 특화된 AI를 써야 했는데, 챗GPT는 번역, 코딩 등 사람이 언어로 할 수 있는 대부분의 일을 수행해요.

 

 

Q. 어떤 점 때문에 성능이 그렇게 좋아진 건가요?

 

가장 중요한 차이는 학습한 데이터의 양과 학습 방식이에요. GPT-3는 무려 1750억 개에 달하는 대용량 매개변수를 사용해요. 매개변수는 AI가 계산을 위해 고려하는 변수로, 일반적으로 매개변수가 많을수록 성능이 좋아요.

 

그러나 데이터가 많다고 해서 무조건 뛰어난 AI를 만들 수 있는 것은 아니에요. 김건희 서울대학교 컴퓨터공학부 교수는 “GPT-3보다 데이터가 훨씬 더 큰 AI도 있지만, 실제론 챗GPT가 훨씬 잘 작동한다”며, “모은 데이터를 어떻게 학습시키는지는 회사의 역량”이라고 설명했어요. 이러한 노하우는 기업 기밀이기 때문에 자세한 내용은 알기 어렵습니다.

 

 

Q. 챗GPT의 유료 버전인 챗GPT 플러스는 무료와 뭐가 다른가요?

 

챗GPT 플러스에서는 2023년 3월 14일에 출시된 오픈AI의 최신 언어 모형인 GPT-4를 사용할 수 있어요. GPT-4는 글만 입력 가능한 GPT-3.5와 달리 이미지도 입력할 수 있어요. 다만 현재는 소수의 개발자만 이미지 입력 기능을 이용할 수 있지요.

 

또 GPT-4는 GPT-3.5보다 언어 능력이 훨씬 향상됐어요. 일례로 기계의 능력을 평가하는 ‘튜링 테스트’도 통과했어요. 튜링 테스트는 영국 수학자이자 컴퓨터과학자 앨런 튜링이 1950년 고안한 것으로, 기계가 튜링 테스트를 통과하면 인간과 동등하거나 구별하기 어려울 정도의 지능을 가졌다는 의미예요. 덕분에 챗GPT 플러스는 복잡한 질문에도 척척 답변할 수 있지요.

 

Q. 플러그인을 사용하면 챗GPT에서 수학 검색 엔진인 울프럼 알파와 같은 기능을 쓸 수 있다는데, 플러그인이 도대체 뭔가요?

 

플러그인은 챗GPT 플러스가 출시된 지 9일 만인 3월 23일에 생긴 기능이에요. 챗GPT에 다른 웹사이트를 연결해서 사용하는 일종의 확장 프로그램을 말해요. 현재(5월 16일 기준)는 울프럼 알파, 여행 정보를 찾는 익스피디아, 식료품을 주문하는 인스타카트 등 총 11개의 플러그인이 있어요. 챗GPT는 이를 통해 기능이 향상되고, 더 다양한 작업을 수행할 수 있어요.

 

예를 들어 사용자가 챗GPT에게 “김치찌개에 들어가는 재료를 알려줘”라고 말한 뒤 인스타카트 플러그인을 사용해 재료를 장바구니에 담고 주문까지 할 수 있지요. 지금은 소수의 개발자에게만 공개된 상태고, 일반 사용자도 차츰 플러그인을 사용할 수 있게 할 예정입니다.

 

Q. 우리나라에는 챗GPT 같은 초대형 언어 모형이 없나요?

 

있어요. 네이버는 국내 기업 최초로 2021년 5월 대규모 AI ‘하이퍼클로바’를 공개했는데요. 당시 GPT-3보다 한국어 데이터를 6,500배 이상 학습한 한국어 기반 AI라 주목을 받았어요. 이 AI를 고도화해 올해 7월 ‘하이퍼클로바X’를 선보일 예정이에요. 카카오도 올해 하반기에 대규모 AI 모델인 ‘코GPT 2.0’을 발표할 예정이에요. 챗GPT보다 한국어 학습량을 늘려 우리나라 말로 된 과제를 더 잘 수행할 거라고 기대하고 있어요. 하지만 영어에 비해 한국어 능력이 훨씬 부족하다는 평가를 받은 GPT-3.5와 달리 GPT-4의 한국어 능력은 77점으로 70.1점이었던 GPT-3.5의 영어 능력보다 높아요. 따라서 국내 기업이 만든 언어 모형의 실효성은 지켜봐야 하지요.

 

Q. 챗GPT의 한계는 무엇인가요?

 

챗GPT는 학습한 데이터를 바탕으로 어떤 질문에도 그럴싸한 답변을 해줘요. 말 그대로 그럴싸한 문장을 만들어준다는 점 때문에 사실 관계에 기반한 내용을 물어보면 틀릴 수도 있지요. 이를 ‘환각(hallucination)’이라고 해요. 따라서 챗GPT를 사용할 때에는 모든 정보를 그대로 믿기 보다는 올바른 정보인지 확인해보는 자세가 필요해요.

 

또 다른 한계는 아직 글이나 사진 정보만 이해할 수 있다는 거예요. 사람은 대화할 때 표정, 말투, 몸짓 등 비언어적 요소를 함께 사용해요. 그런 면에서 아직은 사람과 다르다고 이야기할 수 있어요. 이러한 점을 개선한다면 챗GPT가 영상 정보도 이해하고 답변할 수 있게 될 거예요.

 

Q. 챗GPT로 인해 직업이 사라지거나 새로 생긴다는데 사실인가요?

 

세계적인 투자은행인 골드만삭스에서 2023년 3월 발표한 연구에 따르면 챗GPT와 같은 생성형 AI에 의해 3억 개의 일자리가 자동화될 거라고 해요. 그중 컴퓨터와 수학이 필요한 작업의 29%가 AI에 취약한 것으로 드러났지요. 챗GPT가 수학자에게 어떤 영향을 줄지가 궁금하다면 38쪽을, AI 시대 주목받는 직업이 궁금하다면 44쪽을 참고하세요.

 

Q. 학교나 기업에서는 챗GPT를 어떻게 활용하나요?

 

학교 교육에서 챗GPT를 다양한 방식으로 활용하고 있어요. 교사는 챗GPT를 이용하는 과제를 내고, 학생들도 챗GPT에 모르는 수학 문제를 물어보면서 공부하지요. 영재학교에서 챗GPT를 어떻게 활용하는지 알고 싶다면 18쪽을 확인하세요. 하지만 기업에서는 정보 보안의 문제로 챗GPT 사용을 금지하거나 제한하고 있어요. 삼성전자는 DS(Device Solutions) 부문에 한해 챗GPT를 허용했다가 반도체 정보가 유출되는 사고가 나기도 했어요.

 

챗GPT가 세상에 나온 지 1년이 채 되지 않아 아직 이에 대한 윤리 지침이 제대로 마련되지 않았어요. 유해 콘텐츠 제작 등 사이버 범죄에 악용될 가능성도 있지요. 그래서 챗GPT의 사용을 두고 서로 다른 의견이 대립해요. 이 이야기는 30쪽의 토론에서 더 자세히 해볼게요. 

 

2023년 06월 수학동아 정보

  • 김진화 기자 기자
  • 도움

    김건희(서울대학교 컴퓨터공학부 교수), 김동진(한양대학교 데이터사이언스학과 교수), 서민준(KAIST 김재철AI대학원 교수)
  • 사진

    GIB
  • 디자인

    최서원

🎓️ 진로 추천

  • 컴퓨터공학
  • 정보·통신공학
  • 언론·방송·매체학
이 기사를 읽은 분이 본
다른 인기기사는?