최근 생성형 인공지능(AI)을 활용해 문장을 해석해 이미지나 영상으로 만들어주는 프로그램들이 등장하고 있는 가운데 챗GPT의 개발사 오픈AI도 텍스트를 동영상으로 만들어주는 AI를 공개했다.
오픈AI는 15일(현지시간) 홈페이지를 통해 "사람들이 실제 상호작용이 필요한 문제를 해결하는데 도움이 되도록 움직이는 물리적 세계를 이해하고 시뮬레이션할 수 있게끔 AI를 교육하고 있다"면서 텍스트를 동영상으로 만들어주는(Text to Video, TTV) AI '소라'(Sora)를 소개했다.
오픈AI는 소라에 명령어를 입력하면 최대 1분 길이의 영상을 생성할 수 있고 기존 TTV 서비스에 비해 시각적 품질이 뛰어나며 여러 인물이 등장하는 복잡한 장면도 충분히 구현해낼 수 있다고 설명했다.
오픈AI는 '세련된 여성이 따뜻하게 빛나는 네온사인과 움직이는 도시 간판으로 가득한 도쿄 거리를 걷고 있습니다. 그녀는 검은색 가죽 재킷, 긴 빨간색 드레스, 검은색 부츠를 착용하고 검은색 지갑을 들고 있습니다. 선글라스와 빨간 립스틱을 착용하고 있습니다. 그녀는 자신감 있고 자연스럽게 걷습니다. 길은 축축하고 반사되어 화려한 조명이 거울 효과를 만들어 냅니다. 많은 보행자가 걸어갑니다’라는 상세한 프롬프트에 맞춰 소라가 만들어낸 영상을 공개했다. 영상을 보면 프롬프트에서 요구된 거의 모든 내용이 들어가면서도 제법 자연스럽다.
소라는 TTV 서비스 외에도 이미지를 동영상으로 만들거나 기존 동영상을 확장하고, 누락된 프레임을 채워 부드럽게 만들어주는 기능도 갖췄다.
다만, 당장 소라를 오픈AI가 제공하는 서비스에 녹여내긴 어려울 것으로 보인다. 샘 올트먼 오픈AI 최고경영자(CEO)는 "소라는 한동안 제한된 소수의 창작자만 사용하도록 할 계획"이라고 밝혔다. 비교적 자연스러운 이미지를 형성해내는 것까진 성공했지만, 여전히 좌우 방향을 혼동하거나 원인과 결과의 시간적 순서를 이해하지 못하는 등의 결함을 보였기 때문이다.
현재 소라는 영화 제작사, 비주얼 아티스트, 디자이너 등이 합류한 '레드팀'과 함께 안전성 테스트를 거치고 있다. 레드팀은 AI 시스템의 결함과 취약점을 찾기 위해 회사가 조직한 모의 적군으로 소프트웨어의 보안 강화에 기여한다.
Copyright @ NEWSTREE All rights reserved.