국내 연구진이 값비싼 그래픽처리장치(GPU)나 장비가 없어도 고성능 인공지능(AI)을 만들 수 있는 기술을 개발했다.
한국과학기술원(KAIST) 한동수 전기및전자공학부 교수연구팀은 고가의 GPU 없이도 학습속도를 수백배 높이는 기술을 개발했다고 19일 밝혔다. 최근 AI 모델이 거대화되면서 학습에 필요한 연산량도 크게 늘어 1개당 수천만원에 달하는 고성능 서버용 GPU 여러대와 이를 연결하기 위한 고속 네트워크로 이뤄진 기반 시설이 필요한 상황이다. 다만 중소기업이나 일반 연구자들이 이 같은 규모의 인프라를 구축하는 건 쉽지 않다.
이에 연구진은 분산 학습 프레임워크 '스텔라트레인'을 개발했다. 스텔라트레인은 고성능 GPU보다 20배 저렴한 일반 GPU와 일반 인터넷 환경에서도 효과적인 AI 학습이 가능하도록 돕는 기술이다.
스텔라트레인은 중앙처리장치(CPU)와 GPU를 병렬로 사용해 학습 속도를 높이고 연산 능력의 효율을 높이는 알고리즘에 따라 학습 데이터를 AI 모델별 GPU 활용률에 따라 유동적으로 조절하는 능력도 갖췄다. 이를 이용해 데이터 압축, 전송 속도는 네트워크 속도에 맞춰 조절해 고속 통신 없이도 여러 대의 저가 GPU로 빠른 학습이 가능하다. 기존 데이터 병렬 학습에 비해 최대 104배 빠른 학습이 가능한 수준이다.
연구진은 지난 7월 해당 학습 방식을 적용해 적은 수의 GPU로 챗GPT와 같은 거대 언어 모델(LLM)을 학습하는 새로운 기술도 개발했다. 기존 기술로는 GPU가 64개나 필요한 AI 모델의 학습을 GPU 단 4개만으로도 가능하게 했다.
한 교수는 "누구나 쉽게 대규모 AI 모델 학습에 접근할 수 있게 하는 데 큰 기여를 할 것"이라며 "앞으로도 저비용으로도 대규모 AI 모델을 학습할 수 있는 기술 개발을 계속할 예정"이라고 말했다.
연구 결과는 지난 8월 호주 시드니에서 열린 AI 분야 학술대회 'ACM 시그컴 2024'에서 소개됐다.
Copyright @ NEWSTREE All rights reserved.