d라이브러리









생성AI 2024 트렌드3 - 멀티모달・초거대・맞춤형

생성 인공지능(AI) 기술을 둘러싼 글로벌 빅테크 기업들의 경쟁이 뜨겁다. 오픈AI-마이크로소프트(MS)보다 출발이 늦었던 구글, 메타, 아마존 등이 자체 생성 AI를 속속 공개하며 생성 AI 기술 추격에 나섰다. 2024년 생성 AI 기술 개발 트렌드 3가지를 짚어봤다.

 

트렌드1. 멀티모달 AI

 

오늘날 생성 인공지능(AI)는 이미지, 사운드, 텍스트 등을 동시에 이해하고 생성하는 멀티모달(시각, 청각 등 여러 인터페이스로 정보를 주고 받는) AI로 발전하고 있다. 김영길 한국전자통신연구원(ETRI) 언어지능연구그룹 그룹장은 “2024년 생성 AI 분야의 주요 연구 주제는 멀티모달 AI일 것”이라며 “2024년에는 하나의 생성 AI 서비스가 이미지, 사운드, 텍스트를 모두 생성하는 것이 일상화될 것”이라고 설명했다.

 

실제로 오픈AI-마이크로소프트(이하 오픈AI)는 2023년 9월 챗GPT에 음성 대화 기능과 이미지를 입력, 출력 기능을 추가했다. 그리고 두 달 뒤인 11월, ‘데브데이’ 행사에서 GPT-4에 이미지를 분석하고 출력할 수 있는 멀티모달 AI인 GPT-비전을 접목해 텍스트, 이미지, 사운드 생성이 모두 가능한 멀티모달 AI ‘GPT-4 Turbo’를 선보였다. 데브데이는 오픈AI가 개최하는 개발자 대상 대규모 공개 행사다. 구글도 2023년 12월 7일 멀티모달이 가능한 대규모 언어모델(LLM)인 ‘제미나이’를 공개했다. 제미나이는 문자와 이미지를 생성하고 처리할 수 있는 멀티모달 언어모델로 유튜브 영상과 온라인 이미지 자료를 학습해 폭넓은 추론을 할 수 있다.

 

멀티모달 AI는 빅데이터와 자본력이 바탕이 돼야 개발할 수 있다. 이미지, 음성, 영상 등의 다양한 형태를 가진 대용량의 데이터를 학습하고 처리하기 위해선 수많은 파라미터와 성능 좋은 연산장치가 필요하기 때문이다. 파라미터는 상황에 따라 달라지는 정보인 변수를 처리하기 위한 단위를 뜻한다.  김 그룹장은 “멀티모달 AI의 탄생은 (오픈AI나 구글과 같은) 빅테크 기업이 있기에 가능한 것”이라며 “2024년은 빅테크 기업이 만들어낸 멀티모달 AI 상용화의 원년이 될 것”이라고 말했다.

 

트렌드2. 초거대 AI

 

2020년 재러드 카플란 미국 존슨홉킨스대 교수팀은 연산장치인 컴퓨터가 많을수록, 파라미터와 데이터가 많을수록 생성 AI의 언어 모델링 성능이 좋아진다는 연구 결과를 논문 사전 공개 사이트 ‘아카이브’에 발표했다. doi: 10.48550/arXiv.2001.08361

 

이후 생성 AI 산업에서는 더 많은 데이터와 더 많은 파라미터를 사용해 거대한 생성 AI를 만드는 것이 큰 목표가 됐다. 파라미터가 많아질수록 더 여러 층에 걸쳐 학습이 가능해지고, AI 언어 모델링으로 만든 ‘사전’이 더 완벽해지기 때문이다. 박진영 성균관대 인공지능융합학과 교수는 “앞으로의 생성 AI는 기존의 AI와 비교해 규모와 문제 해결능력이 월등하게 뛰어난 ‘초거대 AI’로 발전할 것”이라고 설명했다. 실제로 2019년 구글이 발표한 T5는 110억 개 정도의 파라미터를 사용했다면, 2020년 오픈AI가 발표한 GPT-3는 1750억 개의 파라미터를 사용했다. 오픈AI가 2023년 3월 14일 공개한 ‘GPT-4’는 정보를 공개하지 않았지만 파라미터가 1조 7000억 개인것으로 추정된다. 김수현 한국과학기술연구원(KIST) 인공지능연구단 책임연구원은 “초거대 AI의 등장은 인간이 할 수 있는 어떤 지적 행동도 해내는 인공일반지능(AGI)의 탄생을 더욱 앞당길 것”이라고 말했다.

 

초거대 AI를 만드는 데 가장 큰 걸림돌은 비용이다. 미국 스탠퍼드대 인간중심 인공지능 연구소가 발표한 ‘2023 인공지능 보고서’는 “2019년 GPT-2(매개변수 15억 개)의 개발 비용은 5만 달러(약만 원)였지만, 2022년 PaLM(매개변수 5400억 개)에는 800만 달러(약 104억 원)가 소요됐다”며 “자본이 풍부한 산업계가 학계를 앞서고 있다”는 분석을 내놨다. 구글 제미나이는 파라미터가 1조 개가 넘는 것으로 추정된다. 사실이라면 개발에 수 억 달러가 투입됐다는 뜻이다.

 

김 연구원은 “생성 AI의  파라미터를 무작정 늘리는 것에는 비용적 한계가 있을 것”이라 지적하며 빅테크 기업들이 새로운 기술 개발에 더 힘을 쏟을 것이라 예측했다. 생성 AI가 트랜스포머 모델의 등장으로 폭발적으로 성장했듯이, 새로운 기술의 등장은 비용 절감으로 이어질 수 있다.

 

물론 기술을 개발하는 데에도 큰 비용 투자가 필요하다. 김 연구원은  “앞으로 더 효율적인 연산 기술을 찾는 것이 모든 AI 과학자들의 공통된 목표가 될 것”이라며 “자본이 풍부한 빅테크 기업이 이번에도 그 선두에 서지 않을까 추측한다”고 말했다.

 

AI가 연산할 때 필요한 그래픽처리장치(GPU) 가격도 만만치 않다. 앞서 파라미터가 AI를 더 똑똑하게 만들어주는 요소라면, GPU는 생성 AI가 더 빠르게 연산하는 데 중요한 역할을 한다. GPU 시장은 현재 시스템반도체 설계기업인 엔비디아가 독점하고 있다. 가격을 보면 엔비디아의 최고사양 GPU인 H100의 가격은 2022년까지만 해도 약 4700만 원이었으나 2023년 4월엔 6000만 원까지 올랐다. 몇 개월 사이에 1300만 원 가량 오른 것이다. 새로운 GPT-5를 훈련하기 위해 H100 3만~5만 개가 필요하다고 추정한 일론 머스크의 계산에 따르면, 생성 AI를 만드는 데 GPU 비용만 약 1조 8000억 원에서 3조 원까지 든다.

 

빅테크 기업들은 자체적으로 개발에 나섰다. 마이크로소프트가 2023년 11월 개발한 AI GPU칩‘마이아100’이 대표적이다. 김 연구원은 “생성 AI의 학습과 추론에 필요한 비용을 절감하는 것은 저렴한 서비스로 이어지고, 이는 다시 사용자의 증가, 빅테크 기업의 자본 증가, 더 좋은 AI 서비스로 이어질 것”이라고 설명했다.

 

트렌드3. 맞춤형 AI

 

국내 검색 시장 점유율 1위인 네이버는 챗GPT 대비 한국어를 6500배 더 많이 학습한 초거대 생성 AI인 하이퍼클로바X를 2023년 8월 공개했다. 네이버는 하이퍼클로바X를 이용해 여러 가지 서비스를 구축하고 있다. 그 중 하나가 맞춤형 상품 추천과 맞춤형 광고 설정이다. 네이버는 과학동아와 진행한 e메일 인터뷰를 통해 “초개인화된 광고는 상호 대화를 통해 사업자가 사용자에게 제안하고 싶은 바와, 사용자가 원하는 바를 모두 전달할 수 있다”며 “서비스 이용자가 마치 오프라인에서 쇼핑하는 것과 같은 경험을 할 수 있다”고 설명했다. 옆에서 점원이 대화하며 안내하듯 소통할 수 있다는 것이다.

 

맞춤형 생성 AI로 구현할 수 있는 서비스가 비단 광고뿐만은 아니다. 해외 빅테크 기업들은 우리 삶에 밀접한 플랫폼에 생성 AI를 추가해 사용자 맞춤형 서비스를 제공한다. 마이크로소프트는 2023년 9월 21일 미국 뉴욕 행사에서 ‘마이크로소프트 코파일럿’ 출시를 알렸다. 이날 공개한 마이크로소프트 코파일럿은 윈도우 11, 마이크로소프트 365, 엣지, 빙 등 마이크로소프트의 플랫폼에서 수행하는 작업을 통합한다. 이를 바탕으로 검색 엔진 엣지와 빙에서는 서비스 이용자의 검색 내용을 학습해 이용자 맞춤형 검색 결과를 제시하고, 워드(Word)에서는 이용자가 입력한 텍스트를 이용자가 원하는 그래픽으로 변환할 수 있다. 나처럼 검색하고 나처럼 쓰고 그리는 생성 AI가 가능해진 것이다. 여기에 원도우의 기본 프로그램인 그림판, 노트패드, 음성 지원 기능 등도 추가될 예정이다.

 

김영길 그룹장은 “우리가 주로 사용하는 문서작업 플랫폼, 검색 플랫폼의 정보가 모두 합쳐진다면 개인의 특성을 파악하는 것이 그리 어려운 일은 아니다”라며 “개인의 특성을 반영한 생성 AI로 업무의 효율성을 올릴 날이 그리 멀지 않았다”고 말했다.

이 기사의 내용이 궁금하신가요?

기사 전문을 보시려면500(500원)이 필요합니다.

이 기사를 읽은 분이 본
다른 인기기사는?