알리바바 Wan2.1 공개 파란

Share

알리바바, 오픈소스 비디오 생성 AI 모델 Wan2.1 공개: Sora와 Veo 2의 대안 등장?

알리바바가 텍스트-투-비디오 AI 모델 Wan2.1을 오픈소스로 공개하면서 비디오 생성 AI 시장에 지각 변동이 예고되고 있습니다. 사용자들은 이제 고성능 PC에서 이 모델을 무료로 다운로드하고 실행할 수 있게 되었습니다. 이는 OpenAI의 Sora나 Google의 Veo 2와 같은 상용 서비스에 대한 매력적인 대안이 될 수 있을까요? 자세히 살펴보겠습니다.

Wan2.1, 현실적인 비디오 생성 능력

알리바바에 따르면 Wan2.1은 복잡한 움직임을 정확하게 처리하고, 픽셀 품질을 향상시키며, 물리적 원리를 준수하고, 명령 실행의 정확성을 최적화하여 현실적인 비디오를 생성하는 데 탁월합니다. 최대 720p 해상도의 짧은 비디오를 생성할 수 있으며, 파라미터 규모는 13억 개에서 140억 개 사이입니다. 1080p 비디오를 생성할 수 있는 모델 출시 계획은 아직 알려지지 않았습니다.

Sora와 Veo 2의 대안?

Sora는 ChatGPT Plus 요금제에 포함되어 월 20달러에 최대 480p 해상도 50개 비디오 또는 더 적은 수의 720p 비디오를 생성할 수 있습니다. Veo 2는 일부 사용자에게만 제공됩니다. Wan2.1은 무료로 사용할 수 있다는 점에서 경쟁력을 갖습니다. 하지만 Jack Gold 애널리스트는 비디오 생성 AI가 아직 초기 단계에 있으며, 장편 영화를 제작하는 수준은 아니라고 지적합니다.

기업 사용자를 위한 새로운 기회

Karl Freund 애널리스트는 오픈소스 텍스트-투-비디오 모델이 기업 사용자에게 새로운 기회를 제공할 것이라고 전망합니다. 그는 멀티미디어에 많은 비용을 지출하는 기업들이 이미 Adobe, OpenAI, Google, X.AI 등의 텍스트-투-이미지 모델을 클라우드에서 사용하고 있으며, 비디오가 다음 단계가 될 것이라고 말합니다. 또한 Amazon Web Services CEO Matt Garman은 고객들이 다양한 사용 사례에 맞는 새로운 옵션을 기대할 수 있다고 언급했습니다.

보안 문제와 중국 AI의 부상

Gold 애널리스트는 Wan2.1 모델이 딥페이크 생성과 같은 악의적인 목적으로 사용될 수 있다는 점을 지적합니다. 또한 중국 AI의 부상에 대한 우려도 제기됩니다. 하지만 Wan2.1은 오픈소스로 공개되어 있어 검사가 가능하며, 오픈소스 옹호자들이 DeepSeek과 마찬가지로 코드를 분석할 것으로 예상됩니다. DeepSeek은 마이크로소프트와 아마존의 클라우드 서비스를 통해 제공되면서 중국 AI 기술의 발전을 보여주는 사례가 되었습니다.

클라우드 제공업체의 새로운 수익 모델?

Freund 애널리스트는 클라우드 제공업체들이 DeepSeek과 마찬가지로 Wan2.1을 활용하여 자체 서비스를 제공하고 수익을 창출할 수 있다고 예상합니다. Wan2.1은 현재 알리바바 클라우드의 AI 모델 커뮤니티인 Model Scope와 Hugging Face에서 다운로드할 수 있습니다. Hugging Face는 Meta의 Llama, 마이크로소프트의 Phi, Google의 Gemma와 같은 공개 AI 모델을 호스팅하고 있습니다.

결론

알리바바의 Wan2.1 오픈소스 공개는 비디오 생성 AI 시장의 경쟁을 더욱 심화시키고, 기업과 개인 사용자들에게 더 많은 선택지를 제공할 것으로 기대됩니다. 다만, 보안 문제와 윤리적인 문제에 대한 지속적인 논의와 기술 발전이 필요할 것입니다.

You may also like...