ChatGPT의 제작회사로 유명세를 떨친 OpenAI가 새로운 도구인 “소라”를 출시했다.
소라는 사용자의 텍스트 스크립트를 기반으로 AI 비디오를 생성하는 새로운 인공지능 프로그램으로, 사용자의 요청에 따라 현실과 거의 비슷한 비디오를 생성해준다. 소라가 생성하는 비디오는 최대 1분까지 가능하며, “여러 캐릭터가 등장하는 복잡한 장면, 특정한 움직임, 정확한 세부사항”을 포함할 수 있다고 회사는 발표했다. 텍스트 외에도 소라는 정지 이미지에서 비디오를 생성하거나 기존 비디오를 확장하고 누락된 프레임을 채우는 기능을 포함한다고 OpenAI는 밝혔다.
이 제품은 초기에 제품 성능 테스트와 피드백을 얻기 위해 소수의 시각 예술가, 디자이너, 영화 제작자에게만 먼저 출시될 것이라고 회사는 말했다. 이 인공지능 프로그램 출시에 대해 유명 유튜버 미스터비스트와 같은 미디어 업계 종사자들은, 자신들의 직업이 없어질 것이라는 두려움을 내비치기도 했다.
OpenAI는 도쿄의 네온 불빛 아래에서 걷는 여성, 눈 위를 달리는 털복숭이 매머드, 아말피 해안의 교회의 항공 뷰, 녹는 촛불 앞에서 호기심에 무릎을 꿇는 몬스터 등 Sora의 능력을 보여주는 여러 예시들을 공유했다. 그러나 회사는 또한 이 초기 도구의 약점을 인정했는데, 물리적으로 복잡한 장면을 시뮬레이션하는 것에 결함이 있고 “원인과 결과”를 이해하지 못한다고 말했다. 예를 들어, 누군가 한 입 먹은 후에도 쿠키가 전체로 나타나는 경우처럼 말이다. 모델은 또한 왼쪽과 오른쪽을 혼동하며, 시간이 지남에 따라 발생하는 사건의 설명에 어려움을 겪는다고 다.
대중들에게 출시하기 전, OpenAI는 또한 Sora가 생성한 비디오를 감지하는 도구를 만들어, 폭력, 성, 혐오 이미지, 유명인의 모습, 타인의 IP를 요청하는 프롬프트를 거부함으로써 안전에 집중하고 있다고 말했다. “우리는 정책 입안자, 교육자, 예술가들과 함께 전 세계에서 그들의 우려를 이해하고 이 새로운 기술에 대한 긍정적인 사용 사례를 식별하기 위해 노력하고 있습니다.”라고 회사는 언급했다.
댓글0