카카오, AI 안전성 검증하는 '카나나 세이프가드' 무료배포

조인준 기자 / 기사승인 : 2025-05-27 09:56:31
  • -
  • +
  • 인쇄
▲카카오가 공개한 '카나나 세이프가드' 모델 개요 (자료=카카오)

카카오가 인공지능(AI) 서비스의 안전성과 신뢰성을 검증할 수 있는 AI 가드레일 모델 '카나나 세이프가드'(Kanana Safeguard) 3종을 오픈소스로 공개한다고 27일 밝혔다. 

최근 다양한 생성형 AI 서비스들이 확산되면서 유해 콘텐츠의 위험성에 대한 우려도 커지고 있다. 이에 카카오는 AI의 안전성과 신뢰성을 검증할 수 있는 '카나나 세이프가드'를 개발하게 됐다.

'카나나 세이프가드'는 카카오가 자체 개발한 언어모델 '카나나'(Kanana)를 기반으로 구축됐으며, 한국어 및 한국 문화를 반영한 자체 구축 데이터셋을 활용했다는 것이 강점이다. AI 모델의 정밀도와 재현율을 평가하는 수치인 F1 스코어를 기준으로 평가한 결과, 한국어 성능에서 글로벌 모델 이상의 성과를 나타냈다.

이번에 오픈소스로 공개한 3종의 모델은 △사용자의 발화 또는 AI의 답변에서 증오, 괴롭힘, 성적 콘텐츠 등에 대한 유해성을 탐지하는 '카나나 세이프가드' △개인 정보나 지식재산권 등  법적 측면에서 주의가 필요한 요청을 탐지하는 '카나나 세이프가드-사이렌' △AI 서비스를 악용하려는 사용자의 공격을 탐지하는 '카나나 세이프가드-프롬프트'다. 이 모델들은 모두 리스크 유형에 따라 유해성 및 위험성에 대한 효과적 탐지가 가능하다. 이 모델들은 AI 오픈 플랫폼 허깅페이스에서 내려받으면 된다.

카카오는 안전한 AI 생태계의 구축에 기여하고자 카나나 세이프가드에 상업적 이용과 수정 및 재배포 등이 자유롭게 가능한 아파치2.0 라이선스를 적용했다. 향후 지속적인 업데이트를 통해 모델을 고도화 할 예정이다.    

카카오 김경훈 AI세이프티 리더는 "생성형 AI의 등장 이래, 기술의 발전과 더불어 AI 윤리와 안전성에 대한 중요성이 국내외에서 점차 부각되고 있다"며 "책임감 있는 AI 구축에 대한 인식을 널리 확산시키고, 사회적 가치를 고려한 기술 개발이 이어질 수 있도록 선제적인 대응을 이어갈 계획"이라고 말했다.

Copyright @ NEWSTREE All rights reserved.

뉴스트리 SNS

  • 뉴스트리 네이버 블로그
  • 뉴스트리 네이버 포스트
  • 뉴스트리 유튜브
  • 뉴스트리 페이스북
  • 뉴스트리 인스타그램
  • 뉴스트리 트위터

핫이슈

+

Video

+

ESG

+

배출권 구매하고 온실가스 감축?...소송 당하는 기업들 급증

탄소배출권을 구매해 온실가스를 상쇄했다고 주장한 기업들이 잇따라 제동이 걸리고 있다. 기후소송이 그만큼 증가하고 있기 때문이다.런던정경대(LSE

엔씨, 탄소배출량 절반으로 감축…'ESG 플레이북 2024' 발간

엔씨소프트가 지난해 탄소배출량을 전년 대비 50% 수준으로 감축했다.엔씨소프트가 지난해 ESG 경영 성과를 담은 지속가능경영 보고서 'ESG 플레이북(PLAY

우리금융, 다문화 장학생 1000명 대상 18.9억 장학금 지원

우리금융이 올해 다문화 장학생 1000명을 선발하고, 18억9000만원의 장학금을 지원한다고 26일 밝혔다. 우리금융은 우리다문화장학재단의 '다문화 장학사

계면활성제 대체제 나오나...LG전자 '유리파우더' 실증 나선다

LG전자가 세탁세제 원료인 계면활성제를 대체할 수 있는 기능성 신소재 유리파우더 '미네랄 워시(Mineral Wash)' 가능성을 확인하기 위한 실증에 나선다.LG

카카오, ESG 보고서 '2024 카카오의 약속과 책임' 발간

카카오가 2024년 한해의 환경, 사회, 지배구조 관련 주요 활동과 성과를 담은 ESG 보고서 '2024 카카오의 약속과 책임'을 25일 발간했다.카카오는 2024년 AI

4대 금융 ESG평가 '최우수'...LG·현대차·KT·SKT 한단계 하락

KB금융, 신한지주, 우리금융, 하나금융 등 4개 금융지주사가 ESG경영 '최우수 기업'으로 선정됐다. LG, 현대자동차, KT, SK텔레콤은 모두 한계단 하락했다.

기후/환경

+

챗GPT로 학교숙제?..."원자력으로 계산기만 쓰는 격"

인공지능(AI)의 탄소배출량이 모델 및 질문에 따라 천차만별인 것으로 나타났다. 질문 수준에 따라 최대 6배, AI 모델 수준에 따라서는 최대 50배까지도

배출권 구매하고 온실가스 감축?...소송 당하는 기업들 급증

탄소배출권을 구매해 온실가스를 상쇄했다고 주장한 기업들이 잇따라 제동이 걸리고 있다. 기후소송이 그만큼 증가하고 있기 때문이다.런던정경대(LSE

"대구가 작아졌다"…1990년대 이후 몸집 절반 줄어든 이유

1990년대 이후 대구의 몸길이가 절반 수준으로 줄어든 이유가 인간의 포획활동을 회피하기 위한 유전적 선택이라는 분석이 나왔다. 인간이 몸집이 큰

열돔에 갇힌 美 대기오염도 악화...뉴욕 3일째 '오존 경보'

미국 중부와 동부를 뒤덮은 열돔 현상이 폭염뿐 아니라 대기질까지 악화시키고 있는 것으로 드러났다. 특히 뉴욕과 롱아일랜드 지역은 지상오존 농도

보조배터리부터 전자담배까지...'패스트테크' 전자폐기물 주범

패스트푸드, 패스트패션에 이어 일명 '패스트테크'로 알려진 저가의 소형 전자제품들이 전세계 전자폐기물 문제의 주범이 되고 있다.패스트테크는 휴

졸업식 도중 150명 '열사병'…美 1.6억명 열돔에 갇혀있다

미국 동부에 위치한 뉴저지주의 한 고등학교 졸업식에서 학생 150여명이 열사병으로 쓰러지는 사고까지 발생했다. 현재 미국은 열돔 현상으로 1억6000만

에너지

+

순환경제

+

오피니언

+