생성형AI 성장속도 벌써?...1년만에 보고듣는 기능까지 갖췄다

조인준 기자 / 기사승인 : 2024-05-16 17:53:35
  • -
  • +
  • 인쇄
▲순다르 피차이 구글 CEO(사진=연합뉴스)


생성형 인공지능(AI)가 예상보다 훨씬 빠른 속도로 성장하고 있다. 생성형 인공지능(AI)인 '챗GPT'를 내놨던 오픈AI는 1년만에 사람처럼 보고 듣고 말하는 AI까지 내놨다.

오픈AI는 지난 13일(현지시간) 텍스트와 이미지를 이해하고 생성하는 것에서 한걸음 나아가, 자연스럽게 실시간 대화도 가능하고 영상을 보면서 직접 말할 수 있는 'GPT-4o'를 공개했다. 이에 질세라, 구글도 지난 14일(현지시간) 동영상, 이미지, 오디오 등을 인식하는 '멀티모달' 능력을 강화한 새로운 AI 비서 '프로젝트 아스트라'를 공개했다.

'GPT-4o'를 탑재한 오픈AI의 챗GPT는 사람의 음성에 즉각 반응하고, 농담을 던지거나 상대방의 감정을 읽어내기까지 한다. 또 카메라를 통해 보이는 이미지를 인식해 수학 문제를 풀어주거나 이용자의 표정도 인식한다. 오픈AI는 "GPT-4o는 사람의 대화 응답 시간과 비슷한 평균 0.32초 내에 질문에 답변하고 '감정'을 담은 것처럼 자연스러운 대화가 가능하다"고 설명했다.

실제로 시연자가 "잠을 잘 못자는 친구를 위해 이야기를 들려달라"고 요구하자 GPT-4o는 마치 할머니가 손자에게 동화를 읽어주듯 이야기를 시작했다. 보다 감정적으로 이야기해 달라 요구하니 마치 성우처럼 극적이고 감정을 섞은 목소리로 대화를 이어나갔다.

오픈AI는 'GPT-4o' 모델이 지난해 11월 선보였던 'GPT-4 터보'보다 두배 더 빠르고 비용은 절반 수준이라고 설명했다. 이에 더해 한국어 등 50개 언어에 대한 품질과 속도도 향상됐으며 개발자들이 새 모델을 사용해 애플리케이션(앱)을 구축할 수 있도록 오픈AI의 API를 통해 이용할 수 있다고 덧붙였다.

구글의 '프로젝트 아스트라'는 구글의 자체 거대언어모델(LLM) '제미나이'와 구글의 음성모델을 기반으로 제작된 AI 비서다. GPT-4o와 마찬가지로 사람처럼 대화하거나 이미지를 인식할 수 있다. 또 구글 지메일과 문서, 캘린더 등 구글 앱에서 개인정보를 가져와 이용자의 계획을 짜주고 일정을 알려준다.

시연 영상에서는 휴대폰 카메라로 주변을 비추면서 '안경이 어디에 있는지 기억해?'라고 묻자 '아까 테이블에 있는 사과 옆에 있었다'고 답하는 모습을 보였다. 또 '인터넷에서 구매한 신발을 환불하고 싶다'고 요청하자 이메일에서 영수증과 주문번호를 찾아 반품신청과 택배예약까지 척척 알아서 해준다.

구글은 '프로젝트 아스트라'의 중간단계로 '제미나이 라이브'를 앞으로 수개월 내에 공개하겠다고 밝혔다. '제미나이 라이브'에도 음성인식 기능이 탑재돼 있어 사람처럼 대화할 수 있지만, 이미지는 실시간 촬영이 아닌 직접 업로드를 통해 인식시켜야 한다.

고작 1년 만에 AI가 직접 듣고 보는 수준까지 발전했음에도 개발자들은 아직 이를 '초기단계'라고 부르고 있다. 순다르 피차이 구글 최고경영자(CEO)는 15일 기자간담회에서 "AI의 획기적인 발전은 하루 아침에 나타나지 않는다"며 "AI는 아직 초기 단계이며, AI 시대 변곡점에 대해 생각할 때 (AI 경쟁은) 큰 그림에서 봐야 한다"고 말했다.

그러면서도 "모든 기술은 긍정적인 면과 부정적인 면이 모두 존재한다"며 "이에 책임감 있게 접근해야 하고, 발전을 이루면서 동시에 악영향을 최소화하기 위한 보호 장치를 마련하는 것이 중요하다"고 강조했다.

한편, 구글은 '제미나이'를 탑재한 검색 엔진을 출시하고 구글 맵·사진·워크스페이스 등 모든 사업 부문에 AI를 접목해 획기적인 변화를 시도했다. 특히, AI의 발달로 사람이 직접 검색 엔진을 이용하는 일이 줄어들 것을 대비해 보다 편리하면서 똑똑한 AI 검색 기능을 내세웠다.

Copyright @ NEWSTREE All rights reserved.

뉴스트리 SNS

  • 뉴스트리 네이버 블로그
  • 뉴스트리 네이버 포스트
  • 뉴스트리 유튜브
  • 뉴스트리 페이스북
  • 뉴스트리 인스타그램
  • 뉴스트리 트위터

핫이슈

+

Video

+

ESG

+

'소프트' 꼬리표 뗀 '엔씨'…"게임 넘어 AI·플랫폼으로 사업 확장"

엔씨소프트가 설립 29년만에 사명을 '엔씨(NC)'로 변경하고 인공지능(AI)과 플랫폼으로 사업영역을 확장한다.27일 업계에 따르면 엔씨는 올해 주력 지적

삼성전자, 용인에 나무 26만그루 심는다...정부와 자연복원활동

경기도 용인 경안천 일대에 2030년까지 약 26만 그루의 나무를 심는다.기후에너지환경부와 삼성전자, 산림청, 한국환경보전원은 27일 경기 용인시 경안

"ESG공시 로드맵, 정책 일관성 흔들려...전면 재검토해야"

금융위원회가 공개한 ESG 공시 로드맵 초안을 놓고 국회와 기후·ESG 싱크탱크가 "글로벌 기준에 뒤처질 뿐 아니라 정부 정책과도 충돌한다"며 전면

[ESG;스코어] 롯데칠성·CJ제일제당 '재생용기' 적용 1·2위...꼴찌는?

중동 전쟁으로 나프타 부족 사태가 발생하면서 재생 플라스틱 전환율이 기업의 원가구조를 좌우하는 경쟁력이 되고 있다. ESG 대응차원에서 시작됐던

서울시, 1000명 넘는 행사 '폐기물 감량계획' 의무화 추진

서울시가 하루 1000명 이상 참여하는 행사에 대해 폐기물 감량계획을 의무적으로 수립하는 방안을 추진하고 있다.서울시는 25개 자치구가 대규모 행사

'생산적 금융' 물꼬 틔우는 시중은행들…투자전략은 '각양각색'

금융당국이 올해부터 향후 5년간 총 1240조원 규모의 생산적 금융 지원계획을 제시하면서, 금융권 자금이 부동산이나 가계대출이 아닌 산업과 기업의

기후/환경

+

[주말날씨] 일교차 크지만 낮 20℃...건조한 바람 '불조심'

이번 주말은 20℃ 안팎까지 기온이 오르며 전국이 대체로 맑고 따뜻하지만 일교차가 크고 건조해 산불 위험도 높겠다. 일부 지역에서는 안개와 약한 비

폭염과 폭우·가뭄이 '동시에'...2025년 한반도 이상기후 더 심해져

2025년은 산업화 이전대비 기온이 1.44℃ 상승한 역대 가장 더웠던 해 3위를 기록한만큼 우리나라도 6월부터 시작된 폭염이 10월까지 이어지는 등 역대급

'빌 게이츠·제프 베이조스' 전용기 기후피해 유발 1·2위...일론 머스크는?

전용기 이용에 따른 온실가스 배출로 기후피해를 가장 많이 유발하는 인물은 마이크로소프트(MS) 창업자인 빌 게이츠인 것으로 드러났다.미국 스탠포

美 36년간 내뿜은 온실가스 1경5000조 피해유발...한국 기후손실액은?

1990년 이후 미국의 온실가스 배출로 인해 전세계가 약 10조달러(약 1경5000조원) 규모의 경제적 피해를 입은 것으로 나타났다. 이 피해는 미국뿐 아니라

서부는 41℃ 폭염, 동부는 눈폭풍…美대륙 '극과 극' 이상기후

미국 서부는 기록적인 폭염을 겪고 있는데 동부는 폭우·폭설·한파가 동시에 나타나는 '극과극' 이상기후가 일어나고 있다. 서부의 이상고온

바닥 드러나는 댐과 하천들...평년 밑도는 강수에 봄 가뭄 '비상'

예년보다 비가 턱없이 적게 내리면서 봄철 가뭄 우려가 현실이 되고 있다. 특히 도서지역과 서해안, 경남 등 지리적 특성상 외부 수자원 의존도가 높은

에너지

+

순환경제

+

오피니언

+