Wan 2.2 AI視頻生成器

Wan 2.2是阿里巴巴達摩院的開源生成式AI視頻模型,於2025年7月28日公開發布。 它在視頻擴散模型中引入了專家混合(MoE)架構,在不增加推理成本的情況下顯著增強了模型容量和性能。 該模型以其電影級美學、高清1080p輸出以及生成複雜、流暢運動的能力而聞名,並且比以前的模型具有更好的控制力。

示例視頻

由Wan 2.2生成

提示
側光,柔光,高對比度,中等拍攝,居中構圖,乾淨的單個主體框架,暖色調。 一個年輕人站在森林里,他的頭輕輕地抬起,眼睛清澈。 陽光透過樹恭弘=叶恭弘,在他的頭髮周圍形成一個金色的光環。 他穿着一件淺色襯衫,微風吹拂着他的頭髮和衣領,每一個動作,光線都在他的臉上舞動。 背景模糊,以遠處斑駁的光線和柔和的樹木輪廓為特色。
Copied
提示
這是一部純粹的視覺和大氣視頻作品,專註於光影的相互作用,以玉米火車為中心主題。 想象一下,一個沐浴在戲劇性的溫暖聚光燈下的舞台,一列玉米火車,呈現出鮮明的輪廓,在空間中緩慢移動。 該視頻探索了火車投射的光影的動態相互作用,創造了在舞台上跳舞的抽象圖案、形狀和幻覺。 配樂應該是環境和極簡主義的,增強作品的大氣和抽象性。
Copied
提示
廣角鏡頭,視頻顯示一名身穿紅色服裝的人站在自動扶梯上,背對着鏡頭。 自動扶梯正在向上移動,人似乎靜止不動。 周圍光線昏暗,反射表面創造了一種鏡像效果,給人一種多個相同人物同時上升的印象。
Copied
提示
一名男子在奔跑,在霓虹燈閃爍的城市夜晚,穿過被雨水浸泡的后巷,濕漉漉的人行道上冒出蒸汽。 他穿着一件濕透的風衣,當他沿着小巷衝刺時,他的臉上充滿了恐慌,不斷地回頭看。 從後面拍攝的追逐序列,讓觀眾深深地沉浸在其中,就好像追逐者就在鏡頭後面。
Copied
提示
一個帶有黃昏色調的復古濾鏡捕捉到了一個平靜的三十多歲的黑人女性坐在行駛中的地鐵車廂里。 周圍的人來回移動,造成了明顯的模糊效果,但她仍然清晰可見。 柔和的光線和電影般的質量在這個喜怒無常的環境中營造出一種神秘的氛圍。
Copied
提示
空中雜技在飛行的飛機機翼上,一名體操運動員穿着紅白相間的運動服向前移動,強風抽打着她的頭髮和衣服。 突然,她在半空中側手翻,優雅地落在金屬翼尖上。 接着,她在咆哮的氣流中做了一個側身翻轉。 結束她的例行公事后,她雙腳站穩腳跟,指尖輕輕地擦過翅膀的邊緣。
Copied
提示
蔚藍的天空下,在一旁柔和溫暖的陽光照射下,一個紅發女子正笑容可掬。 她長長的捲髮在微風中舞動。 她穿着一套飾有花卉圖案的綠色西裝和合身的褲子,搭配引人注目的霓虹綠短靴。 她頭上戴着一頂邊緣微微下垂的大檐草帽。 站在一條覆蓋着金色乾草的鄉村小路上,廣闊的田野和原始的藍色地平線構成了背景。 她舉起雙手,揮舞着一根藍色的花園軟管,從軟管中噴出的是五顏六色的花朵而不是水,像煙花一樣散落在空中。 顏色和形狀各異的花朵在陽光下閃爍着柔和的光澤。
Copied

Wan 2.2的主要功能

Wan 2.2是阿里巴巴達摩院的開源生成式AI視頻模型,於2025年7月28日公開發布。 它在視頻擴散模型中引入了專家混合(MoE)架構,在不增加推理成本的情況下顯著增強了模型容量和性能。 該模型以其電影級美學、高清1080p輸出以及生成複雜、流暢運動的能力而聞名,並且比以前的模型具有更好的控制力。

高級運動生成

在視頻中創建複雜、流暢和自然的動作,提高真實感和連貫性。

電影美學

接受精心策劃的數據培訓,可精確控制燈光、色彩和構圖的視頻。

高清晰度輸出

以24fps的速度生成原生1080p分辨率的視頻,適合專業使用。

專家會議(MoE)

電影攝影機控制 以24fps的速度生成原生1080p分辨率的視頻,適合專業使用。

倒數第一幀到視頻(FLF2V)

通過在指定的開始幀和結束幀之間進行插值來創建無縫視頻過渡。

消費級GPU兼容性

高度壓縮的5B型號可以在RTX 4090等消費級GPU上運行。

開源和可定製

該模型是公開可用的,允許使用LoRA和其他社區開發的工具進行微調。

Wan 2.2功能和使用案例

一個滑板運動員在戶外表演複雜把戲的電影鏡頭。
複雜運動生成
模擬角色和對象的真實物理和自然運動動力學。
電影日夜風景延時
倒數第一幀到視頻
模擬角色和對象的真實物理和自然運動動力學。
黑色電影場景,兩個角色在一個陰暗的,下雨的房間。
電影審美控制
允許精確控制輸出的視覺風格、照明和情緒。
在人群的注視下,黃色直升機在班加羅爾上空放下巨型香蕉片。
高清晰度輸出
以1080p的原生分辨率渲染視頻,無需升級。
在輕輕觸摸下,素描會變成一只3D藍鳥。
LoRA微調
支持集成LoRA模型來微調視頻的風格。
可口可樂廣告變成了一個逼真的3D氣泡瓶。
高效混合TI2V
使用單個模型來支持文本到視頻和圖像到視頻的生成。
超現實樓梯、工業車間、金色舞蹈和發光數字面紗的電影蒙太奇。
開源的
該模型的架構和權重可公開下載。

如何在Vizard上使用Wan 2.2

以下是幫助您在Vizard上探索Wan 2.2的三個簡單步驟:

選擇Wan 2.2型號

選擇Wan 2.2型號

轉到Vizard的文本到視頻生成器,選擇Wan 2.2型號。

輸入您的提示

輸入您的提示

輸入您的提示或上傳您的圖像開始。

保存視頻以供下載或共享

保存視頻以供下載或共享

一旦視頻準備好了,你可以直接通過Vizard下載或分享到你的社交媒體賬戶上。

關於Wan 2.2的YouTube視頻

常見問題

什麼是Wan 2.2?

Wan 2.2是阿里巴巴達摩院開發的最先進的開源生成式人工智能視頻模型。 這是對基礎Wan視頻模型系列的重大升級,旨在根據文本和圖像提示創建高質量的電影視頻。 該模型以其先進的運動生成和美學控制而聞名。

有哪些版本可用?

Wan 2.2有幾個版本,具有不同的功能。 核心開源模型包括高效的TI2V-5B模型,該模型同時支持720p分辨率的文本到視頻(T2V)和圖像到視頻(I2V),可以在消費級GPU上運行。 還有更強大的14B型號,如T2V-A14B和I2V-A14B,它們使用專家混合(MoE)架構,以獲得卓越的質量和性能,適合更健壯的硬件。

是什麼讓它獨一無二?

Wan 2.2因其創新的專家混合(MoE)架構而脫穎而出,該架構將去噪過程分為專門的階段,以獲得更好的性能,而不會顯著增加計算成本。 它還具有電影級的美學控制,能夠生成複雜和流暢的運動,以及在兩個圖像之間創建平滑過渡的倒數第一幀到視頻(FLF2V)功能。 它的開源性質允許社區驅動的微調和集成。

使用安全嗎?

作為一個開源模型,Wan 2.2的安全性很大程度上取決於它是如何實現和使用的。 開發人員已經制定了使用政策,禁止生成非法、有害或誤導性的內容。 雖然該模型本身沒有內置的內容審核系統,但使用Wan 2.2的開發人員和平台應該實施自己的安全措施,以確保負責任的使用並遵守法律和道德標準。

速度有多快?

Wan 2.2針對速度進行了高度優化,尤其是其TI2V-5B型號,這是720p分辨率和24fps下最快的型號之一。 在RTX 4090這樣的消費級GPU上,只需幾分鐘就可以生成5秒的視頻,更強大的硬件可以提供更快的結果。 其高效的專家混合(MoE)架構進一步提高了速度。

可以通過手機訪問嗎?

Wan 2.2主要是一個以開發人員為中心的開源模型。 它沒有來自其生產商的官方專用移動應用程序。 然而,因為它是開源的,開發人員可以將它集成到移動友好的web應用程序中,或者創建自己的移動應用程序。 它的消費級GPU兼容性也使它更容易被擁有高端移動工作站的用戶使用。

它能產生或創造什麼?

Wan 2.2能夠生成各種各樣的視頻內容,從短片廣告和社交媒體剪輯到電影場景和動畫。 它的功能包括文本到視頻、圖像到視頻和基於圖像的繪畫。 用戶可以生成具有特定攝像機運動、精確美學風格以及角色和物體逼真運動的視頻,使其成為技術和創意項目的多功能工具。

怎麼用?

使用Wan 2.2最常見的方法是下載模型文件並在本地兼容機器上運行它們,通常通過ComfyUI或Diffusers等平台進行集成。 為了獲得更易於訪問的體驗,該模型可通過雲API提供商獲得。 還有機會通過Vizard平台免費試用Wan 2.2,該平台提供了一個用於試驗該模型功能的在線界面。

立即在Vizard上開始使用Wan 2.2!

Wan 2.2 AI視頻生成器

Wan 2.2是阿里巴巴達摩院的開源生成式AI視頻模型,於2025年7月28日公開發布。 它在視頻擴散模型中引入了專家混合(MoE)架構,在不增加推理成本的情況下顯著增強了模型容量和性能。 該模型以其電影級美學、高清1080p輸出以及生成複雜、流暢運動的能力而聞名,並且比以前的模型具有更好的控制力。

在Vizard Desktop上試用Wan 2.2
示例視頻

由Wan 2.2生成

提示
側光,柔光,高對比度,中等拍攝,居中構圖,乾淨的單個主體框架,暖色調。 一個年輕人站在森林里,他的頭輕輕地抬起,眼睛清澈。 陽光透過樹恭弘=叶恭弘,在他的頭髮周圍形成一個金色的光環。 他穿着一件淺色襯衫,微風吹拂着他的頭髮和衣領,每一個動作,光線都在他的臉上舞動。 背景模糊,以遠處斑駁的光線和柔和的樹木輪廓為特色。
Copied
提示
這是一部純粹的視覺和大氣視頻作品,專註於光影的相互作用,以玉米火車為中心主題。 想象一下,一個沐浴在戲劇性的溫暖聚光燈下的舞台,一列玉米火車,呈現出鮮明的輪廓,在空間中緩慢移動。 該視頻探索了火車投射的光影的動態相互作用,創造了在舞台上跳舞的抽象圖案、形狀和幻覺。 配樂應該是環境和極簡主義的,增強作品的大氣和抽象性。
Copied
提示
廣角鏡頭,視頻顯示一名身穿紅色服裝的人站在自動扶梯上,背對着鏡頭。 自動扶梯正在向上移動,人似乎靜止不動。 周圍光線昏暗,反射表面創造了一種鏡像效果,給人一種多個相同人物同時上升的印象。
Copied
提示
一名男子在奔跑,在霓虹燈閃爍的城市夜晚,穿過被雨水浸泡的后巷,濕漉漉的人行道上冒出蒸汽。 他穿着一件濕透的風衣,當他沿着小巷衝刺時,他的臉上充滿了恐慌,不斷地回頭看。 從後面拍攝的追逐序列,讓觀眾深深地沉浸在其中,就好像追逐者就在鏡頭後面。
Copied
提示
一個帶有黃昏色調的復古濾鏡捕捉到了一個平靜的三十多歲的黑人女性坐在行駛中的地鐵車廂里。 周圍的人來回移動,造成了明顯的模糊效果,但她仍然清晰可見。 柔和的光線和電影般的質量在這個喜怒無常的環境中營造出一種神秘的氛圍。
Copied
提示
空中雜技在飛行的飛機機翼上,一名體操運動員穿着紅白相間的運動服向前移動,強風抽打着她的頭髮和衣服。 突然,她在半空中側手翻,優雅地落在金屬翼尖上。 接着,她在咆哮的氣流中做了一個側身翻轉。 結束她的例行公事后,她雙腳站穩腳跟,指尖輕輕地擦過翅膀的邊緣。
Copied
提示
蔚藍的天空下,在一旁柔和溫暖的陽光照射下,一個紅發女子正笑容可掬。 她長長的捲髮在微風中舞動。 她穿着一套飾有花卉圖案的綠色西裝和合身的褲子,搭配引人注目的霓虹綠短靴。 她頭上戴着一頂邊緣微微下垂的大檐草帽。 站在一條覆蓋着金色乾草的鄉村小路上,廣闊的田野和原始的藍色地平線構成了背景。 她舉起雙手,揮舞着一根藍色的花園軟管,從軟管中噴出的是五顏六色的花朵而不是水,像煙花一樣散落在空中。 顏色和形狀各異的花朵在陽光下閃爍着柔和的光澤。
Copied

Wan 2.2的主要功能

Wan 2.2是阿里巴巴達摩院的開源生成式AI視頻模型,於2025年7月28日公開發布。 它在視頻擴散模型中引入了專家混合(MoE)架構,在不增加推理成本的情況下顯著增強了模型容量和性能。 該模型以其電影級美學、高清1080p輸出以及生成複雜、流暢運動的能力而聞名,並且比以前的模型具有更好的控制力。

高級運動生成

在視頻中創建複雜、流暢和自然的動作,提高真實感和連貫性。

電影美學

接受精心策劃的數據培訓,可精確控制燈光、色彩和構圖的視頻。

高清晰度輸出

以24fps的速度生成原生1080p分辨率的視頻,適合專業使用。

專家會議(MoE)

電影攝影機控制 以24fps的速度生成原生1080p分辨率的視頻,適合專業使用。

倒數第一幀到視頻(FLF2V)

通過在指定的開始幀和結束幀之間進行插值來創建無縫視頻過渡。

消費級GPU兼容性

高度壓縮的5B型號可以在RTX 4090等消費級GPU上運行。

開源和可定製

該模型是公開可用的,允許使用LoRA和其他社區開發的工具進行微調。

Wan 2.2功能和使用案例

一個滑板運動員在戶外表演複雜把戲的電影鏡頭。
複雜運動生成
模擬角色和對象的真實物理和自然運動動力學。
電影日夜風景延時
倒數第一幀到視頻
模擬角色和對象的真實物理和自然運動動力學。
黑色電影場景,兩個角色在一個陰暗的,下雨的房間。
電影審美控制
允許精確控制輸出的視覺風格、照明和情緒。
在人群的注視下,黃色直升機在班加羅爾上空放下巨型香蕉片。
高清晰度輸出
以1080p的原生分辨率渲染視頻,無需升級。
在輕輕觸摸下,素描會變成一只3D藍鳥。
LoRA微調
支持集成LoRA模型來微調視頻的風格。
可口可樂廣告變成了一個逼真的3D氣泡瓶。
高效混合TI2V
使用單個模型來支持文本到視頻和圖像到視頻的生成。
超現實樓梯、工業車間、金色舞蹈和發光數字面紗的電影蒙太奇。
開源的
該模型的架構和權重可公開下載。

如何在Vizard上使用Wan 2.2

以下是幫助您在Vizard上探索Wan 2.2的三個簡單步驟:

選擇Wan 2.2型號

選擇Wan 2.2型號

轉到Vizard的文本到視頻生成器,選擇Wan 2.2型號。

輸入您的提示

輸入您的提示

輸入您的提示或上傳您的圖像開始。

保存視頻以供下載或共享

保存視頻以供下載或共享

一旦視頻準備好了,你可以直接通過Vizard下載或分享到你的社交媒體賬戶上。

關於Wan 2.2的YouTube視頻

常見問題

什麼是Wan 2.2?

Wan 2.2是阿里巴巴達摩院開發的最先進的開源生成式人工智能視頻模型。 這是對基礎Wan視頻模型系列的重大升級,旨在根據文本和圖像提示創建高質量的電影視頻。 該模型以其先進的運動生成和美學控制而聞名。

有哪些版本可用?

Wan 2.2有幾個版本,具有不同的功能。 核心開源模型包括高效的TI2V-5B模型,該模型同時支持720p分辨率的文本到視頻(T2V)和圖像到視頻(I2V),可以在消費級GPU上運行。 還有更強大的14B型號,如T2V-A14B和I2V-A14B,它們使用專家混合(MoE)架構,以獲得卓越的質量和性能,適合更健壯的硬件。

是什麼讓它獨一無二?

Wan 2.2因其創新的專家混合(MoE)架構而脫穎而出,該架構將去噪過程分為專門的階段,以獲得更好的性能,而不會顯著增加計算成本。 它還具有電影級的美學控制,能夠生成複雜和流暢的運動,以及在兩個圖像之間創建平滑過渡的倒數第一幀到視頻(FLF2V)功能。 它的開源性質允許社區驅動的微調和集成。

使用安全嗎?

作為一個開源模型,Wan 2.2的安全性很大程度上取決於它是如何實現和使用的。 開發人員已經制定了使用政策,禁止生成非法、有害或誤導性的內容。 雖然該模型本身沒有內置的內容審核系統,但使用Wan 2.2的開發人員和平台應該實施自己的安全措施,以確保負責任的使用並遵守法律和道德標準。

速度有多快?

Wan 2.2針對速度進行了高度優化,尤其是其TI2V-5B型號,這是720p分辨率和24fps下最快的型號之一。 在RTX 4090這樣的消費級GPU上,只需幾分鐘就可以生成5秒的視頻,更強大的硬件可以提供更快的結果。 其高效的專家混合(MoE)架構進一步提高了速度。

可以通過手機訪問嗎?

Wan 2.2主要是一個以開發人員為中心的開源模型。 它沒有來自其生產商的官方專用移動應用程序。 然而,因為它是開源的,開發人員可以將它集成到移動友好的web應用程序中,或者創建自己的移動應用程序。 它的消費級GPU兼容性也使它更容易被擁有高端移動工作站的用戶使用。

它能產生或創造什麼?

Wan 2.2能夠生成各種各樣的視頻內容,從短片廣告和社交媒體剪輯到電影場景和動畫。 它的功能包括文本到視頻、圖像到視頻和基於圖像的繪畫。 用戶可以生成具有特定攝像機運動、精確美學風格以及角色和物體逼真運動的視頻,使其成為技術和創意項目的多功能工具。

怎麼用?

使用Wan 2.2最常見的方法是下載模型文件並在本地兼容機器上運行它們,通常通過ComfyUI或Diffusers等平台進行集成。 為了獲得更易於訪問的體驗,該模型可通過雲API提供商獲得。 還有機會通過Vizard平台免費試用Wan 2.2,該平台提供了一個用於試驗該模型功能的在線界面。

立即在Vizard上開始使用Wan 2.2!