[더구루=홍성일 기자] 챗GPT를 개발한 인공지능(AI) 기업 오픈AI가 텍스트를 영상으로 변환해주는 새로운 AI 모델 ‘소라(SORA)’를 공개했다. 오픈AI는 라이브 서비스에 앞서 테스트에 돌입했다.
오픈AI는 15일(현지시간) 텍스트 투 비디오(Text To Video) 모델 ‘소라’를 공개하고 테스트에 돌입했다고 밝혔다. 오픈AI는 “레드팀 구성원들이 해당 모델에 대한 평가를 시작했다”며 “피드백을 얻기위해 다수의 시각 예술가, 디자이너, 영화제작자에게도 접근권을 부여했다”고 덧붙였다.
소라는 프로프트에 입력된 텍스트를 영상으로 만들어주는 생성형 AI 모델로 최대 1분 길이의 영상을 제작할 수 있다고 한다. 이는 기존 비디오 생성 AI가 4초 단위의 영상만이 제작했던 것에 비해 월등히 향상된 수치다.
오픈AI는 “소라가 여러 캐릭터, 특정 유형의 동작, 피사체와 배경의 정확한 디테일 포함된 복잡한 장면을 생성할 수 있다”며 “소라는 사용자가 프롬프트에서 요청한 내용뿐 아니라 실제 세계에서 이런 사물이 어떻게 존재하는지도 이해한다”고 전했다.
그러면서 소라가 아직 복잡한 장면의 물리현상을 정확하게 시뮬레이션하는데 어려움을 겪을 수 있을 뿐 아니라 원인과 결과의 특정 사례를 이해하지 못할 수도 있다고 말했다. 또한 공간적 세부 사항을 혼동하고 카메라 궤적을 따라가는 등의 시간에 따라 발생하는 이벤트를 정확하게 설명하는데 어려움을 겪을 수 있다고 한계도 설명했다.
오픈AI는 소라를 출시하기 전 안전 조치를 취한다. 잘못된 정보, 혐오 콘텐츠 등에 대해 적대적 테스트를 진행해 프롬프트에 극단적인 폭력, 성적 콘텐츠, 혐오 이미지, 유명인의 초상화, 타인의 IP 요청 등의 내용을 적을 시 생성을 제한하는 방안도 마련 중이다. 또한 소라가 생성한 영상의 생성 정보 탐지 툴도 개발하고 있다.
오픈AI 측은 “소라는 실제 세계를 이해하고 시뮬레이션 할 수 있는 모델의 기반 역할을 할 것”이라며 “소라가 일반 인공지능(AGI) 달성을 위한 중요한 이정표가 될 것이라고 믿는다”고 말했다.
샘 알트만 오픈AI 최고경영자(CEO)도 자신의 엑스(X, 옛 트위터)를 통해 “개발팀의 작업물이 놀랍다. 놀라운 순간”이라고 밝혔다.
댓글0