SKT·KT, 한국 특화 'AI 오픈소스' 공개…"AI 대중화 나선다"

조인준 기자 / 기사승인 : 2025-07-03 11:02:52
  • -
  • +
  • 인쇄
▲A.X 4.0의 대규모 학습(CPT)을 진행한 SK텔레콤 자체 구축 슈퍼컴퓨터 '타이탄'(사진=SK텔레콤)

SK텔레콤과 KT가 자체 거대언어모델(LLM)을 오픈소스로 공개했다. 양사는 한국 특화형 LLM을 기업과 개인, 공공에 개방해 국내 인공지능(AI) 대중화에 기여할 방침이다.

SKT와 KT는 자체 개발 LLM인 '에이닷엑스(A.X) 4.0'과 '믿:음 2.0'을 오픈소스 AI 개발자 플랫폼 허깅페이스에 3일 각각 공개했다.

SKT의 A.X 4.0은 현존 LLM 중 최상급의 한국어 처리 효율성을 보이며 데이터 보안을 고려한 설계, 로컬 환경에서의 운영 가능성 등이 강점이다. SKT는 모델에 방대한 한국어 데이터를 추가로 학습시켜 국내 비즈니스 환경에 최적화시켰다.

A.X 4.0의 토크나이저를 자체 설계, 적용해 높은 수준의 한국어 처리 역량을 구현했다. 자체 테스트 결과 같은 한국어 문장을 입력했을 때 GPT-4o보다 A.X 4.0이 약 33% 가량 높은 효율을 기록하며, 다른 LLM 대비 높은 정보 처리용량에 비용 절감까지 가능한 경제성을 갖췄다.

또 대표적인 한국어 능력 평가 벤치마크인 KMMLU2에서 78.3점을 기록하고, 한국어 및 한국 문화 벤치마크인 CLIcK3에서도 83.5점을 획득하는 등 GPT-4o보다 우수한 한국 문화 이해도를 입증했다.

SKT는 A.X 4.0을 기업 내부 서버에 직접 설치해 사용할 수 있는 온프레미스 방식으로 제공할 방침이다. 표준 모델은 720억개, 경량 모델은 70억개의 매개변수를 갖추고 있어 이용자들이 목적에 맞춰 선택적으로 이용할 수 있도록 했다.

KT는 '한국적 AI' 철학을 담은 믿:음 2.0을 앞세워 국내 AI 생태계 활성화에 기여할 것이라고 밝혔다. 믿:음은 한국적 독자 AI 모델로서 고품질 한국어 데이터를 준비하는 과정에서 모든 저작권을 확보해 신뢰성을 높였다. 이번에 선보인 모델은 115억 파라미터 규모인 '믿:음 2.0 Base'와 23억 파라미터 규모의 '믿:음 2.0 Mini' 2종이다.

믿:음 모델은 한국어와 한국 문화 및 사회 등 전문 분야에서 기존의 국내외 주요 모델을 상회하는 이해력과 생성 성능을 입증했다. KT와 고려대학교가 공동 개발한 한국어 AI 역량 평가 지표 'Ko-Sovereign'(코-소버린) 벤치마크에서 글로벌 최고 수준의 오픈소스 모델을 능가하는 점수를 기록했다.

KT는 국내 교육용 도서와 문화 작품 등의 발간물, 법률 및 특허 문서, 각종 사전 등 다양한 산업·공공·문화 영역에서 방대한 한국 특화 데이터를 확보해 믿:음 2.0 학습에 활용했다.

KT는 "한국어의 구조와 언어학적 특성을 반영한 토크나이저를 자체 개발하고, 필터링으로 줄어든 데이터 규모는 데이터 합성 방법론을 적용해 보완했다"며 "이를 통해 한국 사회 고우의 언어와 문화적 맥락을 정교하게 반영, 한국어 사용자에 최적화된 언어 이해 능력과 정밀한 표현력을 지닌 모델로 구현했다"고 설명했다.

양사는 이번 오픈소스 공개를 시작으로 국내에 '한국적 AI' 확산을 통한 생태계 구성 선도에 나설 방침이다. SKT는 이달 내로 수학 문제 해결과 코드 개발 능력이 강화된 추론형 모델을 공개하고 이미지와 텍스트를 동시에 이해하고 처리할 수 있는 수준까지 모델을 업데이트할 계획이다. 또 후속 모델도 순차적으로 공개할 예정이다. KT는 마이크로소프트(MS)와 협업으로 GPT-4에 한국적 사고를 추가 학습시킨 모델을 공개할 계획이라 밝혔다.

Copyright @ NEWSTREE All rights reserved.

뉴스트리 SNS

  • 뉴스트리 네이버 블로그
  • 뉴스트리 네이버 포스트
  • 뉴스트리 유튜브
  • 뉴스트리 페이스북
  • 뉴스트리 인스타그램
  • 뉴스트리 트위터

핫이슈

+

Video

+

ESG

+

현대차, 올해 청년 7200명 신규 채용...내년엔 1만명 확대 검토

현대자동차그룹이 올해 총 7200명을 신규 채용한다고 18일 밝혔다. 내년에는 청년 채용 규모를 1만명으로 확대하는 방안을 검토한다.현대차그룹의 청년

롯데카드, 해킹으로 297만명 정보 털렸다...카드번호, CVC까지 유출

롯데카드 해킹 사고 피해규모가 당초 예상했던 것보다 더 심각한 것으로 나타났다. 이에 롯데카드는 피해 고객 전원에게 전액 보상을 하겠다는 방침이

삼성전자, 5년간 6만명 신규채용...'반도체·바이오·AI' 중심

삼성전자가 성장사업 육성과 청년 일자리 창출을 위해 앞으로 5년간 6만명을 신규 채용하겠다고 18일 밝혔다. 매년 1만2000명씩 채용하겠다는 계획이다.

"상장기업 보고, 6개월로 바꾸자"...트럼프 주장에 美 또 '술렁'

미국 상장기업의 보고서가 분기에서 반기로 변경될 가능성이 커지고 있다.17일(현지시간) AP통신에 따르면, 도널드 트럼프 미국 대통령이 상장기업의

카카오, 지역 AI생태계 조성 위해 5년간 '500억원' 푼다

카카오그룹이 앞으로 5년간 500억원의 기금을 조성해 지역 인공지능(AI) 생태계 육성에 투자한다고 18일 밝혔다. 카카오그룹은 지역 AI 육성을 위한 거점

[ESG;NOW] 올해 RE100 100% 목표 LG엔솔 '절반의 성공'

국내 많은 기업들이 지속가능한 경영을 내세우면서 'ESG(환경·사회·지배구조)' 보고서 혹은 지속가능경영 보고서를 주기적으로 발간하고 있

기후/환경

+

가뭄이거나 폭우거나...온난화로 지구기후 갈수록 '극과극'

전 지구적으로 기후 불균형이 심각해지고 있다는 분석이다. 18일(현지시간) 세계기상기구(WMO)는 '글로벌 수자원 현황 2024' 보고서를 통해 수개월째 비가

"재생에너지 188조 필요한데…정책금융 투자액은 여전히 안갯속"

2030 국가온실가스감축목표(NDC)를 달성하려면 재생에너지 설비에 188조원을 투자해야 하지만 마중물 역할을 하는 정책금융 대부분은 재생에너지보다 화

지역 1인당 교통 배출량, 서울의 2배…"무상버스가 대안"

비수도권 교통 배출량이 서울의 2배에 달하면서 '무상버스'가 대안으로 떠오르고 있다.녹색전환연구소가 18일 발표한 보고서 '작은 도시의 교통 혁명,

'2035 NDC' 60% 넘어설까...환경부, 7차례 토론회 연다

2035년 국가 온실가스 감축 목표(2035 NDC)를 설정하기 위한 대국민 논의가 시작된다.환경부는 오는 19일부터 내달 14일까지 '2035 국가 온실가스 감축목표

뜨거워지는 한반도...2100년 폭염일수 9배 늘어난다

한반도 기온이 매년 상승하고 있어 2100년에 이르면 여름철 극한강우 영향지역이 37%로 확대되고 강수량도 12.6% 증가한다는 전망이다. 또 폭염일수도 지

국민 61.7% "2035년 온실가스 감축목표 60% 넘어야"

우리나라 국민의 61.7%는 2035년까지 온실가스를 60% 이상 감축해야 한다는데 동의하는 것으로 나왔다.기후솔루션이 지난달 한국리서치에 의뢰해 성인 200

에너지

+

순환경제

+

오피니언

+