2025年2月25日、Alibaba Cloudは、彼らの先進的なAIビデオ生成モデル「Wan 2.1」をオープンソース化したことを発表しました。このモデルはTongyiシリーズの一部であり、テキストプロンプトを高品質のビデオに変換し、複雑な動きや空間関係を得意としています。そのオープンソース化は、AI駆動のビデオ制作を民主化する重要なステップを意味します。
Wan 2.1は、OpenAIのSora、Minimax、KuaishouのKling、GoogleのVeo 2のようなモデルが支配する競争の激しい市場に登場します。
84.7%のVBenchスコアを誇り、中国語と英語の多言語サポートを提供し、無料アクセスを約束するWan 2.1は、かなりの影響を及ぼす準備が整っています。本記事では、Wan 2.1のパフォーマンス、特徴、価格、ユーザー体験、そして競合他社との比較を掘り下げ、最終的にはオープンソースの地位がAIビデオ生成の未来にどのような意味を持つのかを探ります。
今日、anakin.aiにサインアップして無料で始めましょう。世界中のクリエイターとつながり、Wan 2.1に備えましょう — Anakinで先を行きましょう!

Wan 2.1: どこが際立っているのか?
Wan 2.1、またの名をWanx 2.1またはTongyi Wanxiは、AlibabaのTongyiシリーズのマルチモーダルAIモデルの一部です。テキストプロンプトを驚くべきビデオに変換し、フィギュアスケートや複数のオブジェクトの相互作用など、複雑な動きと空間関係をマスターしています。AlibabaおよびVBenchリーダーボードによると、84.7%のスコアでライバルを凌駕し、ダイナミックな動き、滑らかさ、美的感覚で際立っています。回転するダンサーやレースカーのリアルなビジュアルを、あなたの説明に合わせて提供します。
際立った特徴は、中国語と英語の多言語サポートであり、多様な市場をターゲットとするクリエイターにとって完璧です。クリスプな1080pビデオを30FPSで生成し、プロフェッショナルグレードのビジュアルに匹敵します。2025年2月25日にオープンソースとして発表されたWan 2.1は、Stable Diffusionと同様の革新を促し、現実世界での影響や競争相手に対する優位性に関する疑問を呼び起こすかもしれません。
Wan 2.1をSora、Minimax、Kling、Google Veo 2と比較する
Wan 2.1のAIビデオ生成分野での位置付けを理解するために、OpenAIのSora、Minimax、Kling(Kuaishou製)、GoogleのVeo 2などの大手と比較してみましょう。これらのモデルそれぞれには強みがありますが、Wan 2.1はトップコンペティターになるためのユニークな利点を持っています。
OpenAIのSora

Soraは、2024年末にローンチされ、ソーシャルメディアやマーケティング用に20秒の高品質なビデオを生成し、ChatGPT Plus/Pro($20/$200月額)とバンドルされています。プロユーザーに向けた高解像度や無制限の休日アクセスを提供し、短く素晴らしいクリップに優れています。英語と短さに制限され、VBenchで82%のスコアですが、Wan 2.1は84.7%のスコアと多言語サポートで、長く複雑なシーケンスに対する柔軟性を示唆しています。
Minimax

Minimaxは、中国のマルチモーダルAIであり、ビデオ生成とテキストから画像への効率を統合しています。ダイナミックなシーンにおいてVBenchでWan 2.1に劣り、グローバルアクセスは制限されており、企業向けサブスクリプションが必要なことが多いです。Wan 2.1のオープンソースの利点はリーチを広げますが、Minimaxはスピードによるニッチなリアルタイム編集で優れるかもしれません。
Kling(Kuaishou)

KlingはKuaishouから提供されており、高解像度な出力と滑らかな動きでDouyinのようなショートフォームコンテンツに優れています。中国だけに制限され、オープンソースではないため、Wan 2.1よりもグローバル性は劣りますが、多言語サポートとより広範な可能性を提供します。KlingはKuaishouの地域エコシステムから利益を得ています。
Google Veo 2

Veo 2は、2024年12月にSoraの後に発表され、Google CloudのVertex AIを介して米国の早期アクセスユーザーをターゲットにし、使用に応じた料金(例:$0.00003/1k文字)を提供しています。リアリズムと美的感覚で強みを持ち、83%のVBenchスコアはWan 2.1の84.7%には及びません。Wan 2.1のオープンソースの柔軟性は開発者にアピールし、Veo 2は堅牢なインフラを使った企業向けニーズに適しています。
Wan 2.1はどれほど優れたものになるか?
そのVBenchリーダーシップと技術仕様に基づくと、Wan 2.1は利用可能な最高のオープンソースAIビデオモデルの一つとなる可能性があります。84.7%のVBenchスコアは、複雑な動き、複数のオブジェクトの相互作用、空間関係をほとんどの競争相手よりも優れて扱えることを示しています。クリエイターにとっては、アーティファクトの少ないビデオ、滑らかなトランジション、プロンプトへの正確な遵守を意味します — SFバトルや穏やかな自然のシーンをアニメーション化する際にも。
しかし、完璧なモデルは存在しません。Wan 2.1は、非常に長いシーケンスや非常に抽象的なプロンプトに苦しむかもしれません。この分野では、SoraやVeo 2のようなプロプライエタリモデルが閉じたシステムの最適化により優位性を持つことがあります。また、オープンソースの性質は、開発者がどのように微調整するかによってパフォーマンスが変動する可能性があり、適切に管理されない場合には、一貫しない結果を招くこともあります。それでも、ほとんどのユーザー — 特にクリエイティブな業界や中小企業のユーザーには — Wan 2.1の質、アクセシビリティ、コスト効果の組み合わせが非常に期待できます。
価格、パフォーマンス、機能、ユーザー体験
価格
Wan 2.1はいくらになるのでしょうか?オープンソースモデルとして、そのコアはおそらく無料で使用、ダウンロード、修正できます。Stable DiffusionやLLaMAのように。Alibaba Cloudは、プレミアム機能、クラウドホスティング、APIアクセスに対して料金を請求するかもしれません — おそらく企業利用に対して月額$100〜$500で、SoraやVeo 2に似ています。現在、AlibabaのModel Studioで無料で提供されており、コミュニティホスティングが趣味のユーザーのコストをさらに削減する可能性があります。
パフォーマンス
Wan 2.1は、84.7%のVBenchスコアで優れたパフォーマンスを発揮し、ダイナミックなシーン、空間の一貫性、美的感覚をうまく処理します。1080pで30FPSのリアルな動きを提供し、オープンソースのビデオ生成で先導的な存在ですが、Soraのようなプロプライエタリモデルは特定の分野で優位を持つかもしれません。
機能
Wan 2.1は多言語のテキスト(中国語と英語)、カスタマイズ可能な解像度、フレームレートをサポートし、Alibabaのエコシステムに統合されています。使いやすく、技術的スキルを必要とせず、オープンソースの可能性は機能を追加するかもしれませんが、リアルタイム編集のようなプロプライエタリの特典を見逃すかもしれません。
ユーザーエクスペリエンス
インターフェースはシンプルで、テキストを入力し、設定を調整し、ビデオをダウンロードするだけで良いので、技術的でないユーザーにとって優れています。オープンソースのセットアップは、SoraのChatGPTの簡単さやVeo 2のGoogle Cloudの洗練さとは異なり、ある程度のノウハウが必要かもしれませんが、コミュニティの成長が時間とともに改善される可能性があります。
オープンソース発表: 転換点
2025年2月25日、Alibaba_Wanによる発表(「これはドリルではありません — Wan 2.1のオープンソースがついに登場しました!」)は、世界中の興奮を引き起こしました。UTC+8の午後11時のライブ放送では、オープンソースの条件、入手可能性、制限について触れられた可能性があります。これは、Stable Diffusionの影響に似て、趣味のユーザー、スタートアップ、研究者にAIビデオ生成を提供するかもしれませんが、オープンソースには質の一貫性やセキュリティに関するリスクが伴います。
ユーザーにとっては、強力で無料のツールを提供しますが、長期的なサポート、更新、企業の信頼性についての懸念を引き起こします。AlibabaのAIおよびクラウドの信頼性は固い支援を示唆していますが、コミュニティの役割はWan 2.1の成功にとって重要です。
結論: Wan 2.1のAIビデオ革命における位置づけ
Wan 2.1は単なるAIモデルではありません — それは潜在的なゲームチェンジャーであり、特にそのオープンソースの地位のおかげでそうです。そのVBenchをリードするパフォーマンス、多言語サポート、アクセシビリティは、Sora、Minimax、Kling、Veo 2などの強力なライバルとなるでしょう。特に柔軟性とコスト削減を求めるクリエイターや開発者にとっては。すべてのニッチにおいてプロプライエタリモデルと同等になることはないかもしれません(たとえば、リアルタイム編集や企業統合において)、そのオープンソースの性質は活気あるコミュニティの育成を促し、革新と採用を推進する可能性があります。
一般ユーザーにとって、Wan 2.1は、マーケティングで広告を作成したり、教育でレッスンを作成したり、新しいアイデアを試したりする際に、最小限の努力とコストでプロフェッショナル品質のビデオを作成する機会を提供します。その価格(プレミアム機能に対して無料または低コストの可能性)、トップクラスのパフォーマンス、ユーザーフレンドリーな体験は、AIビデオ分野で見逃せない存在として位置づけられています。ライブ放送が展開され、詳細が明らかになるにつれて、Wan 2.1はAI駆動の創造性についての考え方を再定義する可能性があります — オープンで、アクセス可能で、無限に適応可能です。