
차세대 지능형반도체(PIM)의 통신 성능을 최대 11배까지 향상할 수 있는 기술이 개발됐다.
19일 한국과학기술원(KAIST) 전기및전자공학부 김동준 교수 연구팀은 미국 노스이스턴대학과 보스턴대학, 스페인 무르시아대학의 연구진과 'PIM 반도체간 집합통신에 특화된 인터커넥션 네트워크 아키텍처'에 대해 공동연구를 진행한 결과, PIM 반도체의 통신 성능을 비약적으로 향상하는 기법을 개발하는데 성공했다고 밝혔다.
PIM 반도체는 인공지능, 빅데이터, 생명과학 등 연구에 사용되는 메모리 대역폭이 차지하는 비중이 높아 개발된 메모리 내부에 연산장치를 배치하는 프로세싱-인-메모리(Processing-in-Memory, PIM)다.
김동준 교수 연구팀은 기존 PIM 반도체가 갖는 메모리 내부 연산장치간 통신구조의 한계를 밝히고, 기존에 메모리 내부에 존재하는 데이터 이동을 위한 버스 구조를 최대한 활용하면서 각 연산장치를 직접적으로 상호 연결하는 인터커넥션 네트워크 구조를 적용함으로써 PIM 반도체의 통신 성능을 극대화하는 기법을 제안했다.
인터커넥션 네트워크는 다중 연산 장치를 포함하는 대규모 시스템 설계에 쓰이는 연산장치간 연결구조다. 또 다중연산장치를 포함하는 시스템 설계의 필수요소 중 하나로, 시스템 규모가 커질수록 더욱 중요해지는 특징이 있다. 이를 통해 연구팀은 PIM 반도체를 위한 연산 과정에서 통신 처리를 위한 중앙처리장치(CPU)의 개입을 최소화해 PIM 반도체 시스템의 전체적인 성능과 활용성을 높인 PIM 반도체에 특화된 인터커넥션 네트워크 구조를 개발했다.
기존 PIM 반도체들이 통신하기 위해서는 CPU를 거쳐야만 하기 때문에 상당한 성능 손실이 있었다. 하지만 연구팀은 PIM 특화 인터커넥션 네트워크를 적용하면 기존 시스템 대비 어플리케이션 성능을 최대 11배 향상했다고 밝혔다. 또 메모리 공정은 복잡한 로직의 추가가 어렵다는 문제점이 있는데 김동준 교수팀이 개발한 네트워크 구조는 PIM에서 비용 효율적인 인터커넥트를 구현했다.
이 구조는 병렬 컴퓨팅과 기계학습 분야에서 널리 활용되는 집합 통신(Collective communication) 패턴에 특화돼 있으며, 각 연산장치의 통신량과 데이터 이동 경로를 미리 파악할 수 있다는 집합 통신의 결정성(determinism) 특징을 활용해 기존 네트워크에서 비용을 발생시키는 주요 구성 요소들을 최소화했다.
김동준 교수는 "데이터 이동(data movement)을 줄이는 것은 PIM을 포함한 모든 시스템 반도체에서 핵심적인 요소이며, PIM은 컴퓨팅 시스템의 성능과 효율성을 향상할 수 있지만 PIM 연산장치간 데이터 이동으로 인해 성능 확장성이 제약될 수 있어 응용 분야가 제한적이고, PIM 인터커넥트가 이에 대한 해법이 될 수 있다"고 강조했다.
이번 연구결과는 컴퓨터 구조분야 최우수 국제학술대회인 '2025 IEEE International Symposium on High Performance Computer Architecture, HPCA 2025'에서 올 3월 발표될 예정이다.
Copyright @ NEWSTREE All rights reserved.