Wan 2.2ai वीडियो जनरेटर

वान 2.2 अलीबाबा की डामो अकादमी से एक ओपन-सोर्स जनरेटिव एआई वीडियो मॉडल है, जिसे सार्वजनिक रूप से 28 जुलाई, 2025 को जारी किया गया था। यह वीडियो प्रसार मॉडल में विशेषज्ञों के मिश्रण (MoE) वास्तुकला का परिचय देता है, जो अनुमान लागत को बढ़ाए बिना मॉडल क्षमता और प्रदर्शन को काफी बढ़ाता है। यह मॉडल अपने सिनेमाटिक स्तर के सौंदर्यशास्त्र, उच्च-परिभाषा 1080p आउटपुट, और पिछले मॉडलों की तुलना में अधिक नियंत्रण के साथ जटिल, द्रव गति उत्पन्न करने की इसकी क्षमता के लिए उल्लेखनीय है।

उदाहरण वीडियो

वान 2.2 द्वारा उत्पन्न

संकेत देना
साइडलिट, नरम प्रकाश, उच्च विपरीत, मध्यम शॉट, केंद्रित रचना, स्वच्छ एकल विषय फ्रेम, गर्म टोन। एक युवक जंगल में खड़ा है, उसका सिर धीरे-धीरे उठाया गया है, साफ आँखें हैं। सूर्य की रोशनी पत्तियों के माध्यम से फ़िल्टर करती है, जिससे उसके बालों के चारों ओर एक सुनहरा भेरा पैदा होता है। हल्के रंग की शर्ट पहने हुए, एक हवा उसके बालों और कॉलर के साथ खेलती है क्योंकि प्रकाश प्रत्येक आंदोलन के साथ उसके चेहरे पर नाचती है। पृष्ठभूमि धुंधला है, दूर के डप्पल प्रकाश और नरम पेड़ सिल्हूट की विशेषता है।
Copied
संकेत देना
एक विशुद्ध रूप से दृश्य और वायुमंडलीय वीडियो टुकड़ा प्रकाश और छाया के इंटरप्ले पर ध्यान केंद्रित करता है, जिसमें एक मकई ट्रेन केंद्रीय मोटिफ के रूप में है। नाटकीय, गर्म स्पॉटलाइट्स में स्नान किए गए एक मंच की कल्पना करें, जहां एक मकई ट्रेन, एक स्पष्ट सिल्हूट के रूप में प्रस्तुत, अंतरिक्ष में धीरे-धीरे चलती है। यह वीडियो ट्रेन द्वारा डाले गए प्रकाश और छाया के गतिशील इंटरप्ले की खोज करता है, अमूर्त पैटर्न, आकार और भ्रम बनाता है जो मंच पर नृत्य करते हैं। साउंडट्रैक परिवेशी और न्यूनतम होना चाहिए, जो टुकड़े की वायुमंडलीय और अमूर्त प्रकृति को बढ़ाता है।
Copied
संकेत देना
वाइड शॉट, वीडियो में लाल पोशाक में एक व्यक्ति को एस्केलेटर पर खड़ा, कैमरे से दूर सामना करते हुए दिखाया गया है। एस्केलेटर ऊपर की ओर बढ़ रहा है, और व्यक्ति स्थिर दिखता है। आसपास के वातावरण परावर्तनशील सतहों के साथ मंद रोशनी होती है जो एक दर्पण प्रभाव बनाती है, जो एक साथ कई समान आंकड़ों को उठाने की छाप देती है।
Copied
संकेत देना
एक भागने वाला आदमी, एक नियोन-रोशनी वाली शहर की रात की बारिश से भीगे पीछे की गलियों से गुजरता है, गीली फुटपाथ से भाप उठता है। वह एक भीगे हुए ट्रेंच कोट में पहना हुआ है, उसके चेहरे पर घबराहट से नक़्क़ाशी हुई है जब वह गली में दौड़ता है, लगातार अपने कंधे पर देख रहा है। पीछे से शूट किया गया एक पीछा अनुक्रम, दर्शक को गहराई से विसर्जित करता है, जैसे कि पीछा करने वाले कैमरा लेंस के ठीक पीछे हैं।
Copied
संकेत देना
शाम के टोन के साथ एक विंटेज फिल्टर एक चलती मेट्रो कार में बैठी एक शांत, तीस-कुछ काली महिला को पकड़ता है। आसपास के लोग आगे और पीछे जा रहे थे, एक अलग धुंधला प्रभाव पैदा कर रहे थे, लेकिन वह स्पष्ट रूप से दिखाई देती रही। नरम प्रकाश और सिनेमाई गुणवत्ता इस मूडी सेटिंग में एक रहस्यमय माहौल बनाती है।
Copied
संकेत देना
उड़ने वाले विमान के पंख पर हवाई कलाबाजी, लाल और सफेद जिम सूट में पहने एक जिमनास्ट आगे बढ़ते हुए तेज हवाएं उसके बालों और कपड़ों को कोड़ा देती हैं। अचानक, वह एक मध्य हवा के कार्टव्हील में छलांग लगाती है, धातु के पंखों की नोक पर सुंदरता से उतरती है। इसके बाद, वह गर्जने वाली हवा की धाराओं के बीच साइड फ्लिप करती है। अपनी दिनचर्या का समापन करते हुए, वह दोनों पैरों को मजबूती से लगाकर खुद को स्थिर करती है, उंगलियों की नोक पंख के किनारे को हल्के से चराती है।
Copied
संकेत देना
एक विशाल नीले आकाश के नीचे, किनारे से कोमल और गर्म सूरज की रोशनी से रोशन किया गया, एक लाल बालों वाली महिला मुस्कुराती और खुशी से हंसी रही थी। उसके लंबे, घुंघराले बाल हवा में नृत्य करते हैं। फूलों के पैटर्न और फिट पतलून से सजाए गए हरे रंग के सूट में, वह अपने पोशाक को नीयन हरे टखने के जूते के साथ जोड़ती हैं। एक बड़ी किनारे वाली भूसे की टोपी, किनारों पर थोड़ा झुकती है, उसके सिर का मुकुट रखती है। सुनहरे घास से ढके ग्रामीण रास्ते पर खड़े, विशाल खेत और एक आदिम नीला क्षितिज पृष्ठभूमि बनाता है। हाथों को ऊपर रखते हुए, वह एक नीली बगीचे की नली लहराती है, जिससे पानी के बजाय बहुरंगी फूलों का एक कैस्केड फूट जाता है, हवा में आतिशबाजी की तरह बिखर जाता है। रंग और आकार में विविध फूल सूर्य की किरणों के नीचे कोमल चमक के साथ चमकते हैं।
Copied

वान 2.2 की मुख्य विशेषताएं

वान 2.2 अलीबाबा की डामो अकादमी से एक ओपन-सोर्स जनरेटिव एआई वीडियो मॉडल है, जिसे सार्वजनिक रूप से 28 जुलाई, 2025 को जारी किया गया था। यह वीडियो प्रसार मॉडल में विशेषज्ञों के मिश्रण (MoE) वास्तुकला का परिचय देता है, जो अनुमान लागत को बढ़ाए बिना मॉडल क्षमता और प्रदर्शन को काफी बढ़ाता है। यह मॉडल अपने सिनेमाटिक स्तर के सौंदर्यशास्त्र, उच्च-परिभाषा 1080p आउटपुट, और पिछले मॉडलों की तुलना में अधिक नियंत्रण के साथ जटिल, द्रव गति उत्पन्न करने की इसकी क्षमता के लिए उल्लेखनीय है।

उन्नत गति पीढ़ी

वीडियो में जटिल, द्रव और प्राकृतिक आंदोलनों का निर्माण करता है, यथार्थवाद और सुसंगतता में सुधार करता है।

फिल्म सौंदर्यशास्त्र

प्रकाश, रंग और रचना पर सटीक नियंत्रण के साथ वीडियो बनाने के लिए सावधानीपूर्वक क्यूरेटेड डेटा पर प्रशिक्षित किया गया है।

उच्च परिभाषा आउटपुट

24fps पर देशी 1080p रिज़ॉल्यूशन के साथ वीडियो बनाता है, जो पेशेवर उपयोग के लिए उपयुक्त है।

विशेषज्ञों का मिश्रण (MoE)

सिनेमा कैमरा नियंत्रण 24fps पर देशी 1080p रिज़ॉल्यूशन के साथ वीडियो बनाता है, जो पेशेवर उपयोग के लिए उपयुक्त है।

वीडियो के लिए पहला अंतिम फ्रेम (FLF2V)

निर्दिष्ट शुरुआत और अंत फ्रेम के बीच प्रक्षेप करके निर्बाध वीडियो संक्रमण बनाता है।

उपभोक्ता ग्रेड जीपीयू संगतता

एक अत्यधिक संपीड़ित 5b मॉडल उपलब्ध है जो आरटीएक्स 4090 की तरह उपभोक्ता जीपीएस पर चल सकता है।

ओपन सोर्स और अनुकूलित योग्य

मॉडल सार्वजनिक रूप से उपलब्ध है, जो लोरा और अन्य समुदाय-विकसित उपकरणों के साथ ठीक ट्यूनिंग की अनुमति देता है।

Wan 2.2 क्षमता और उपयोग के मामले

बाहर एक जटिल चाल का प्रदर्शन करने वाले एक स्केटबोर्डर का सिनेमाटिक शॉट।
जटिल गति पीढ़ी
पात्रों और वस्तुओं के लिए यथार्थवादी भौतिकी और प्राकृतिक गति गतिशीलता का अनुकरण करता है।
सिनेमा दिन-रात लैंडस्केप टाइम-लैप
वीडियो के लिए पहला अंतिम फ्रेम
पात्रों और वस्तुओं के लिए यथार्थवादी भौतिकी और प्राकृतिक गति गतिशीलता का अनुकरण करता है।
छाया वाले, बारिश वाले कमरे में दो पात्रों का फिल्म नोयर दृश्य।
सिनेमा सौंदर्य नियंत्रण
आउटपुट की दृश्य शैली, प्रकाश व्यवस्था और मूड पर सटीक नियंत्रण की अनुमति देता है।
पीले हेलीकॉप्टर ने बेंगलुरु पर केले के विशाल चिप्स गिराए, भीड़ ने देखा।
उच्च परिभाषा आउटपुट
1080p के देशी रिज़ॉल्यूशन के साथ वीडियो रेंडर करता है, जो अपस्केलिंग की आवश्यकता को समाप्त करता है।
स्केच एक कोमल स्पर्श के तहत एक 3 डी ब्लूबर्ड में बदल जाता है।
लोरा ठीक ट्यूनिंग
वीडियो की शैली को ठीक ट्यून करने के लिए लोरा मॉडल के एकीकरण का समर्थन करता है।
कोका-कोला विज्ञापन फिज के साथ एक यथार्थवादी 3 डी बोतल में बदल जाता है।
कुशल हाइब्रिड ti2v
पाठ से वीडियो और छवि से वीडियो जनरेशन दोनों का समर्थन करने के लिए एक ही मॉडल का उपयोग करता है।
अरियल सीढ़ियों, औद्योगिक कार्यशाला, सुनहरे नृत्य और चमकदार डिजिटल घूंघट का सिनेमाटिक मोंटेज।
खुला स्रोत
मॉडल की वास्तुकला और वजन सार्वजनिक रूप से डाउनलोड के लिए उपलब्ध हैं।

विज़ार्ड पर वान 2.2 का उपयोग कैसे करें

विज़ार्ड पर वान 2.2 का पता लगाने में मदद करने के लिए यहां तीन सरल चरण दिए गए हैंः

वान 2.2 मॉडल चुनें

वान 2.2 मॉडल चुनें

Vizard के टेक्स्ट टू वीडियो जनरेटर पर जाएं और wan 2.2 मॉडल का चयन करें।

अपना प्रॉम्प्ट दर्ज करें

अपना प्रॉम्प्ट दर्ज करें

शुरू करने के लिए अपना प्रॉम्प्ट दर्ज करें या अपनी छवि अपलोड करें।

डाउनलोड या साझा करने के लिए अपना वीडियो सहेजें

डाउनलोड या साझा करने के लिए अपना वीडियो सहेजें

एक बार जब वीडियो तैयार हो जाता है, तो आप इसे डाउनलोड कर सकते हैं या सीधे विज़ार्ड के माध्यम से अपने सोशल मीडिया अकाउंट पर शेयर कर सकते हैं।

वान 2.2 के बारे में यूट्यूब वीडियो

फैक्ट फॉर्म

वान 2.2 क्या है?

वान 2.2 अलीबाबा की डामो अकादमी द्वारा विकसित एक अत्याधुनिक, ओपन-सोर्स जनरेटिव एआई वीडियो मॉडल है। यह फाउंडेशनल वान वीडियो मॉडल श्रृंखला का एक प्रमुख अपग्रेड है, जिसे पाठ और छवि प्रॉम्प्ट्स से उच्च गुणवत्ता वाले, सिनेमाटिक वीडियो बनाने के लिए डिज़ाइन किया गया है। यह मॉडल अपने उन्नत गति पीढ़ी और सौंदर्य नियंत्रण के लिए जाना जाता है।

क्या संस्करण उपलब्ध है?

Wan 2.2 अलग-अलग क्षमताओं के साथ कई संस्करणों में उपलब्ध है। कोर ओपन-सोर्स मॉडल में कुशल ti2v-5b मॉडल शामिल है, जो 720p रिज़ॉल्यूशन पर टेक्स्ट-टू-वीडियो (T2V) और इमेज-टू-वीडियो (I2V) दोनों का समर्थन करता है और उपभोक्ता-ग्रेड जीपीएस पर चल सकता है। अधिक शक्तिशाली 14b मॉडल भी हैं, जैसे कि t2v-a14b और i2v-a14b, जो अधिक मजबूत हार्डवेयर के लिए उपयुक्त बेहतर गुणवत्ता और प्रदर्शन के लिए विशेषज्ञों के मिश्रण (MoE) वास्तुकला का उपयोग करते हैं।

इसे अनूठा क्या बनाता है?

Wan 2.2 अपने अभिनव मिश्रण-ऑफ-विशेषज्ञों (MoE) वास्तुकला के कारण बाहर खड़ा है, जो गणना लागत में महत्वपूर्ण वृद्धि के बिना बेहतर प्रदर्शन के लिए विशेष चरणों में denoising प्रक्रिया को अलग करता है। इसमें सिनेमाटिक स्तर के सौंदर्य नियंत्रण, जटिल और द्रव गति उत्पन्न करने की क्षमता, और एक पहले-अंतिम फ्रेम से वीडियो (FLF2V) फ़ंक्शन भी है जो दो छवियों के बीच चिकनी संक्रमण बनाता है। इसकी ओपन-सोर्स प्रकृति समुदाय-संचालित फाइन-ट्यूनिंग और एकीकरण की अनुमति देती है।

क्या इस्तेमाल करना सुरक्षित है?

एक ओपन-सोर्स मॉडल के रूप में, वान 2.2 की सुरक्षा काफी हद तक इस बात पर निर्भर करती है कि इसे कैसे लागू किया जाता है और उपयोग किया जाता है। डेवलपर्स ने एक उपयोग नीति स्थापित की है जो अवैध, हानिकारक या भ्रामक सामग्री की पीढ़ी को प्रतिबंधित करता है। जबकि मॉडल में स्वयं एक अंतर्निहित सामग्री मॉडरेशन प्रणाली नहीं है, वैन 2.2 का उपयोग करने वाले डेवलपर्स और प्लेटफॉर्म को कानूनी और नैतिक मानकों के साथ जिम्मेदार उपयोग और अनुपालन सुनिश्चित करने के लिए अपने स्वयं के सुरक्षा उपायों को लागू करने की उम्मीद है।

यह कितनी तेज है?

वान 2.2 गति के लिए अत्यधिक अनुकूलित है, विशेष रूप से इसका ti2v-5b मॉडल, जो 720p रिज़ॉल्यूशन और 24fps पर उपलब्ध सबसे तेज में से एक है। एक 5-सेकंड वीडियो को आरटीएक्स 4090 की तरह उपभोक्ता जीपीयू पर केवल कुछ मिनट में उत्पन्न किया जा सकता है, जिसमें अधिक शक्तिशाली हार्डवेयर और भी तेज परिणाम प्रदान करता है। इसकी कुशल मिश्रण-ऑफ-एक्सपर्ट्स (MoE) आर्किटेक्चर द्वारा गति को और बढ़ाया जाता है।

क्या यह मोबाइल के माध्यम से सुलभ है?

Wan 2.2 मुख्य रूप से एक डेवलपर्-केंद्रित, ओपन-सोर्स मॉडल है। इसके पास अपने निर्माता की ओर से कोई आधिकारिक, समर्पित मोबाइल ऐप नहीं है। हालांकि, क्योंकि यह ओपन-सोर्स है, डेवलपर्स इसे मोबाइल-फ्रेंडली वेब एप्लिकेशन में एकीकृत कर सकते हैं या अपने स्वयं के मोबाइल एप्लिकेशन बना सकते हैं। इसकी उपभोक्ता-ग्रेड जीपीयू संगतता भी इसे उच्च अंत मोबाइल वर्कस्टेशनों के साथ उपयोगकर्ताओं के लिए अधिक सुलभ बनाती है।

यह क्या उत्पन्न कर सकता है या बना सकता है?

वान 2.2 शॉर्ट-फॉर्म विज्ञापनों और सोशल मीडिया क्लिप से लेकर सिनेमाटिक दृश्यों और एनिमेशन तक विभिन्न प्रकार की वीडियो सामग्री उत्पन्न करने में सक्षम है। इसकी क्षमताओं में पाठ से वीडियो, छवि से वीडियो और छवि आधारित इन-पेंटिंग शामिल हैं। उपयोगकर्ता विशिष्ट कैमरा आंदोलनों, सटीक सौंदर्य शैलियों और पात्रों और वस्तुओं के लिए यथार्थवादी आंदोलन के साथ वीडियो उत्पन्न कर सकते हैं, जिससे यह तकनीकी और रचनात्मक दोनों परियोजनाओं के लिए एक बहुमुखी उपकरण बन जाता है।

इसका उपयोग कैसे किया जा सकता है?

वान 2.2 का उपयोग करने का सबसे आम तरीका मॉडल फ़ाइलों को डाउनलोड करना और उन्हें एक संगत मशीन पर स्थानीय रूप से चलाना है, अक्सर comfyui या diffuser जैसे प्लेटफार्मों के माध्यम से एकीकरण के साथ। अधिक सुलभ अनुभव के लिए, मॉडल क्लाउड एपीआई प्रदाताओं के माध्यम से उपलब्ध है। विज़ार्ड प्लेटफॉर्म के माध्यम से मुफ्त में वान 2.2 की कोशिश करने का भी अवसर है, जो मॉडल की क्षमताओं के साथ प्रयोग करने के लिए एक ऑनलाइन इंटरफ़ेस प्रदान करता है।

अब विज़ार्ड पर वान 2.2 के साथ शुरू करें!

Wan 2.2ai वीडियो जनरेटर

वान 2.2 अलीबाबा की डामो अकादमी से एक ओपन-सोर्स जनरेटिव एआई वीडियो मॉडल है, जिसे सार्वजनिक रूप से 28 जुलाई, 2025 को जारी किया गया था। यह वीडियो प्रसार मॉडल में विशेषज्ञों के मिश्रण (MoE) वास्तुकला का परिचय देता है, जो अनुमान लागत को बढ़ाए बिना मॉडल क्षमता और प्रदर्शन को काफी बढ़ाता है। यह मॉडल अपने सिनेमाटिक स्तर के सौंदर्यशास्त्र, उच्च-परिभाषा 1080p आउटपुट, और पिछले मॉडलों की तुलना में अधिक नियंत्रण के साथ जटिल, द्रव गति उत्पन्न करने की इसकी क्षमता के लिए उल्लेखनीय है।

विज़ार्ड डेस्कटॉप पर wan 2.2 की कोशिश करें
उदाहरण वीडियो

वान 2.2 द्वारा उत्पन्न

संकेत देना
साइडलिट, नरम प्रकाश, उच्च विपरीत, मध्यम शॉट, केंद्रित रचना, स्वच्छ एकल विषय फ्रेम, गर्म टोन। एक युवक जंगल में खड़ा है, उसका सिर धीरे-धीरे उठाया गया है, साफ आँखें हैं। सूर्य की रोशनी पत्तियों के माध्यम से फ़िल्टर करती है, जिससे उसके बालों के चारों ओर एक सुनहरा भेरा पैदा होता है। हल्के रंग की शर्ट पहने हुए, एक हवा उसके बालों और कॉलर के साथ खेलती है क्योंकि प्रकाश प्रत्येक आंदोलन के साथ उसके चेहरे पर नाचती है। पृष्ठभूमि धुंधला है, दूर के डप्पल प्रकाश और नरम पेड़ सिल्हूट की विशेषता है।
Copied
संकेत देना
एक विशुद्ध रूप से दृश्य और वायुमंडलीय वीडियो टुकड़ा प्रकाश और छाया के इंटरप्ले पर ध्यान केंद्रित करता है, जिसमें एक मकई ट्रेन केंद्रीय मोटिफ के रूप में है। नाटकीय, गर्म स्पॉटलाइट्स में स्नान किए गए एक मंच की कल्पना करें, जहां एक मकई ट्रेन, एक स्पष्ट सिल्हूट के रूप में प्रस्तुत, अंतरिक्ष में धीरे-धीरे चलती है। यह वीडियो ट्रेन द्वारा डाले गए प्रकाश और छाया के गतिशील इंटरप्ले की खोज करता है, अमूर्त पैटर्न, आकार और भ्रम बनाता है जो मंच पर नृत्य करते हैं। साउंडट्रैक परिवेशी और न्यूनतम होना चाहिए, जो टुकड़े की वायुमंडलीय और अमूर्त प्रकृति को बढ़ाता है।
Copied
संकेत देना
वाइड शॉट, वीडियो में लाल पोशाक में एक व्यक्ति को एस्केलेटर पर खड़ा, कैमरे से दूर सामना करते हुए दिखाया गया है। एस्केलेटर ऊपर की ओर बढ़ रहा है, और व्यक्ति स्थिर दिखता है। आसपास के वातावरण परावर्तनशील सतहों के साथ मंद रोशनी होती है जो एक दर्पण प्रभाव बनाती है, जो एक साथ कई समान आंकड़ों को उठाने की छाप देती है।
Copied
संकेत देना
एक भागने वाला आदमी, एक नियोन-रोशनी वाली शहर की रात की बारिश से भीगे पीछे की गलियों से गुजरता है, गीली फुटपाथ से भाप उठता है। वह एक भीगे हुए ट्रेंच कोट में पहना हुआ है, उसके चेहरे पर घबराहट से नक़्क़ाशी हुई है जब वह गली में दौड़ता है, लगातार अपने कंधे पर देख रहा है। पीछे से शूट किया गया एक पीछा अनुक्रम, दर्शक को गहराई से विसर्जित करता है, जैसे कि पीछा करने वाले कैमरा लेंस के ठीक पीछे हैं।
Copied
संकेत देना
शाम के टोन के साथ एक विंटेज फिल्टर एक चलती मेट्रो कार में बैठी एक शांत, तीस-कुछ काली महिला को पकड़ता है। आसपास के लोग आगे और पीछे जा रहे थे, एक अलग धुंधला प्रभाव पैदा कर रहे थे, लेकिन वह स्पष्ट रूप से दिखाई देती रही। नरम प्रकाश और सिनेमाई गुणवत्ता इस मूडी सेटिंग में एक रहस्यमय माहौल बनाती है।
Copied
संकेत देना
उड़ने वाले विमान के पंख पर हवाई कलाबाजी, लाल और सफेद जिम सूट में पहने एक जिमनास्ट आगे बढ़ते हुए तेज हवाएं उसके बालों और कपड़ों को कोड़ा देती हैं। अचानक, वह एक मध्य हवा के कार्टव्हील में छलांग लगाती है, धातु के पंखों की नोक पर सुंदरता से उतरती है। इसके बाद, वह गर्जने वाली हवा की धाराओं के बीच साइड फ्लिप करती है। अपनी दिनचर्या का समापन करते हुए, वह दोनों पैरों को मजबूती से लगाकर खुद को स्थिर करती है, उंगलियों की नोक पंख के किनारे को हल्के से चराती है।
Copied
संकेत देना
एक विशाल नीले आकाश के नीचे, किनारे से कोमल और गर्म सूरज की रोशनी से रोशन किया गया, एक लाल बालों वाली महिला मुस्कुराती और खुशी से हंसी रही थी। उसके लंबे, घुंघराले बाल हवा में नृत्य करते हैं। फूलों के पैटर्न और फिट पतलून से सजाए गए हरे रंग के सूट में, वह अपने पोशाक को नीयन हरे टखने के जूते के साथ जोड़ती हैं। एक बड़ी किनारे वाली भूसे की टोपी, किनारों पर थोड़ा झुकती है, उसके सिर का मुकुट रखती है। सुनहरे घास से ढके ग्रामीण रास्ते पर खड़े, विशाल खेत और एक आदिम नीला क्षितिज पृष्ठभूमि बनाता है। हाथों को ऊपर रखते हुए, वह एक नीली बगीचे की नली लहराती है, जिससे पानी के बजाय बहुरंगी फूलों का एक कैस्केड फूट जाता है, हवा में आतिशबाजी की तरह बिखर जाता है। रंग और आकार में विविध फूल सूर्य की किरणों के नीचे कोमल चमक के साथ चमकते हैं।
Copied

वान 2.2 की मुख्य विशेषताएं

वान 2.2 अलीबाबा की डामो अकादमी से एक ओपन-सोर्स जनरेटिव एआई वीडियो मॉडल है, जिसे सार्वजनिक रूप से 28 जुलाई, 2025 को जारी किया गया था। यह वीडियो प्रसार मॉडल में विशेषज्ञों के मिश्रण (MoE) वास्तुकला का परिचय देता है, जो अनुमान लागत को बढ़ाए बिना मॉडल क्षमता और प्रदर्शन को काफी बढ़ाता है। यह मॉडल अपने सिनेमाटिक स्तर के सौंदर्यशास्त्र, उच्च-परिभाषा 1080p आउटपुट, और पिछले मॉडलों की तुलना में अधिक नियंत्रण के साथ जटिल, द्रव गति उत्पन्न करने की इसकी क्षमता के लिए उल्लेखनीय है।

उन्नत गति पीढ़ी

वीडियो में जटिल, द्रव और प्राकृतिक आंदोलनों का निर्माण करता है, यथार्थवाद और सुसंगतता में सुधार करता है।

फिल्म सौंदर्यशास्त्र

प्रकाश, रंग और रचना पर सटीक नियंत्रण के साथ वीडियो बनाने के लिए सावधानीपूर्वक क्यूरेटेड डेटा पर प्रशिक्षित किया गया है।

उच्च परिभाषा आउटपुट

24fps पर देशी 1080p रिज़ॉल्यूशन के साथ वीडियो बनाता है, जो पेशेवर उपयोग के लिए उपयुक्त है।

विशेषज्ञों का मिश्रण (MoE)

सिनेमा कैमरा नियंत्रण 24fps पर देशी 1080p रिज़ॉल्यूशन के साथ वीडियो बनाता है, जो पेशेवर उपयोग के लिए उपयुक्त है।

वीडियो के लिए पहला अंतिम फ्रेम (FLF2V)

निर्दिष्ट शुरुआत और अंत फ्रेम के बीच प्रक्षेप करके निर्बाध वीडियो संक्रमण बनाता है।

उपभोक्ता ग्रेड जीपीयू संगतता

एक अत्यधिक संपीड़ित 5b मॉडल उपलब्ध है जो आरटीएक्स 4090 की तरह उपभोक्ता जीपीएस पर चल सकता है।

ओपन सोर्स और अनुकूलित योग्य

मॉडल सार्वजनिक रूप से उपलब्ध है, जो लोरा और अन्य समुदाय-विकसित उपकरणों के साथ ठीक ट्यूनिंग की अनुमति देता है।

Wan 2.2 क्षमता और उपयोग के मामले

बाहर एक जटिल चाल का प्रदर्शन करने वाले एक स्केटबोर्डर का सिनेमाटिक शॉट।
जटिल गति पीढ़ी
पात्रों और वस्तुओं के लिए यथार्थवादी भौतिकी और प्राकृतिक गति गतिशीलता का अनुकरण करता है।
सिनेमा दिन-रात लैंडस्केप टाइम-लैप
वीडियो के लिए पहला अंतिम फ्रेम
पात्रों और वस्तुओं के लिए यथार्थवादी भौतिकी और प्राकृतिक गति गतिशीलता का अनुकरण करता है।
छाया वाले, बारिश वाले कमरे में दो पात्रों का फिल्म नोयर दृश्य।
सिनेमा सौंदर्य नियंत्रण
आउटपुट की दृश्य शैली, प्रकाश व्यवस्था और मूड पर सटीक नियंत्रण की अनुमति देता है।
पीले हेलीकॉप्टर ने बेंगलुरु पर केले के विशाल चिप्स गिराए, भीड़ ने देखा।
उच्च परिभाषा आउटपुट
1080p के देशी रिज़ॉल्यूशन के साथ वीडियो रेंडर करता है, जो अपस्केलिंग की आवश्यकता को समाप्त करता है।
स्केच एक कोमल स्पर्श के तहत एक 3 डी ब्लूबर्ड में बदल जाता है।
लोरा ठीक ट्यूनिंग
वीडियो की शैली को ठीक ट्यून करने के लिए लोरा मॉडल के एकीकरण का समर्थन करता है।
कोका-कोला विज्ञापन फिज के साथ एक यथार्थवादी 3 डी बोतल में बदल जाता है।
कुशल हाइब्रिड ti2v
पाठ से वीडियो और छवि से वीडियो जनरेशन दोनों का समर्थन करने के लिए एक ही मॉडल का उपयोग करता है।
अरियल सीढ़ियों, औद्योगिक कार्यशाला, सुनहरे नृत्य और चमकदार डिजिटल घूंघट का सिनेमाटिक मोंटेज।
खुला स्रोत
मॉडल की वास्तुकला और वजन सार्वजनिक रूप से डाउनलोड के लिए उपलब्ध हैं।

विज़ार्ड पर वान 2.2 का उपयोग कैसे करें

विज़ार्ड पर वान 2.2 का पता लगाने में मदद करने के लिए यहां तीन सरल चरण दिए गए हैंः

वान 2.2 मॉडल चुनें

वान 2.2 मॉडल चुनें

Vizard के टेक्स्ट टू वीडियो जनरेटर पर जाएं और wan 2.2 मॉडल का चयन करें।

अपना प्रॉम्प्ट दर्ज करें

अपना प्रॉम्प्ट दर्ज करें

शुरू करने के लिए अपना प्रॉम्प्ट दर्ज करें या अपनी छवि अपलोड करें।

डाउनलोड या साझा करने के लिए अपना वीडियो सहेजें

डाउनलोड या साझा करने के लिए अपना वीडियो सहेजें

एक बार जब वीडियो तैयार हो जाता है, तो आप इसे डाउनलोड कर सकते हैं या सीधे विज़ार्ड के माध्यम से अपने सोशल मीडिया अकाउंट पर शेयर कर सकते हैं।

वान 2.2 के बारे में यूट्यूब वीडियो

फैक्ट फॉर्म

वान 2.2 क्या है?

वान 2.2 अलीबाबा की डामो अकादमी द्वारा विकसित एक अत्याधुनिक, ओपन-सोर्स जनरेटिव एआई वीडियो मॉडल है। यह फाउंडेशनल वान वीडियो मॉडल श्रृंखला का एक प्रमुख अपग्रेड है, जिसे पाठ और छवि प्रॉम्प्ट्स से उच्च गुणवत्ता वाले, सिनेमाटिक वीडियो बनाने के लिए डिज़ाइन किया गया है। यह मॉडल अपने उन्नत गति पीढ़ी और सौंदर्य नियंत्रण के लिए जाना जाता है।

क्या संस्करण उपलब्ध है?

Wan 2.2 अलग-अलग क्षमताओं के साथ कई संस्करणों में उपलब्ध है। कोर ओपन-सोर्स मॉडल में कुशल ti2v-5b मॉडल शामिल है, जो 720p रिज़ॉल्यूशन पर टेक्स्ट-टू-वीडियो (T2V) और इमेज-टू-वीडियो (I2V) दोनों का समर्थन करता है और उपभोक्ता-ग्रेड जीपीएस पर चल सकता है। अधिक शक्तिशाली 14b मॉडल भी हैं, जैसे कि t2v-a14b और i2v-a14b, जो अधिक मजबूत हार्डवेयर के लिए उपयुक्त बेहतर गुणवत्ता और प्रदर्शन के लिए विशेषज्ञों के मिश्रण (MoE) वास्तुकला का उपयोग करते हैं।

इसे अनूठा क्या बनाता है?

Wan 2.2 अपने अभिनव मिश्रण-ऑफ-विशेषज्ञों (MoE) वास्तुकला के कारण बाहर खड़ा है, जो गणना लागत में महत्वपूर्ण वृद्धि के बिना बेहतर प्रदर्शन के लिए विशेष चरणों में denoising प्रक्रिया को अलग करता है। इसमें सिनेमाटिक स्तर के सौंदर्य नियंत्रण, जटिल और द्रव गति उत्पन्न करने की क्षमता, और एक पहले-अंतिम फ्रेम से वीडियो (FLF2V) फ़ंक्शन भी है जो दो छवियों के बीच चिकनी संक्रमण बनाता है। इसकी ओपन-सोर्स प्रकृति समुदाय-संचालित फाइन-ट्यूनिंग और एकीकरण की अनुमति देती है।

क्या इस्तेमाल करना सुरक्षित है?

एक ओपन-सोर्स मॉडल के रूप में, वान 2.2 की सुरक्षा काफी हद तक इस बात पर निर्भर करती है कि इसे कैसे लागू किया जाता है और उपयोग किया जाता है। डेवलपर्स ने एक उपयोग नीति स्थापित की है जो अवैध, हानिकारक या भ्रामक सामग्री की पीढ़ी को प्रतिबंधित करता है। जबकि मॉडल में स्वयं एक अंतर्निहित सामग्री मॉडरेशन प्रणाली नहीं है, वैन 2.2 का उपयोग करने वाले डेवलपर्स और प्लेटफॉर्म को कानूनी और नैतिक मानकों के साथ जिम्मेदार उपयोग और अनुपालन सुनिश्चित करने के लिए अपने स्वयं के सुरक्षा उपायों को लागू करने की उम्मीद है।

यह कितनी तेज है?

वान 2.2 गति के लिए अत्यधिक अनुकूलित है, विशेष रूप से इसका ti2v-5b मॉडल, जो 720p रिज़ॉल्यूशन और 24fps पर उपलब्ध सबसे तेज में से एक है। एक 5-सेकंड वीडियो को आरटीएक्स 4090 की तरह उपभोक्ता जीपीयू पर केवल कुछ मिनट में उत्पन्न किया जा सकता है, जिसमें अधिक शक्तिशाली हार्डवेयर और भी तेज परिणाम प्रदान करता है। इसकी कुशल मिश्रण-ऑफ-एक्सपर्ट्स (MoE) आर्किटेक्चर द्वारा गति को और बढ़ाया जाता है।

क्या यह मोबाइल के माध्यम से सुलभ है?

Wan 2.2 मुख्य रूप से एक डेवलपर्-केंद्रित, ओपन-सोर्स मॉडल है। इसके पास अपने निर्माता की ओर से कोई आधिकारिक, समर्पित मोबाइल ऐप नहीं है। हालांकि, क्योंकि यह ओपन-सोर्स है, डेवलपर्स इसे मोबाइल-फ्रेंडली वेब एप्लिकेशन में एकीकृत कर सकते हैं या अपने स्वयं के मोबाइल एप्लिकेशन बना सकते हैं। इसकी उपभोक्ता-ग्रेड जीपीयू संगतता भी इसे उच्च अंत मोबाइल वर्कस्टेशनों के साथ उपयोगकर्ताओं के लिए अधिक सुलभ बनाती है।

यह क्या उत्पन्न कर सकता है या बना सकता है?

वान 2.2 शॉर्ट-फॉर्म विज्ञापनों और सोशल मीडिया क्लिप से लेकर सिनेमाटिक दृश्यों और एनिमेशन तक विभिन्न प्रकार की वीडियो सामग्री उत्पन्न करने में सक्षम है। इसकी क्षमताओं में पाठ से वीडियो, छवि से वीडियो और छवि आधारित इन-पेंटिंग शामिल हैं। उपयोगकर्ता विशिष्ट कैमरा आंदोलनों, सटीक सौंदर्य शैलियों और पात्रों और वस्तुओं के लिए यथार्थवादी आंदोलन के साथ वीडियो उत्पन्न कर सकते हैं, जिससे यह तकनीकी और रचनात्मक दोनों परियोजनाओं के लिए एक बहुमुखी उपकरण बन जाता है।

इसका उपयोग कैसे किया जा सकता है?

वान 2.2 का उपयोग करने का सबसे आम तरीका मॉडल फ़ाइलों को डाउनलोड करना और उन्हें एक संगत मशीन पर स्थानीय रूप से चलाना है, अक्सर comfyui या diffuser जैसे प्लेटफार्मों के माध्यम से एकीकरण के साथ। अधिक सुलभ अनुभव के लिए, मॉडल क्लाउड एपीआई प्रदाताओं के माध्यम से उपलब्ध है। विज़ार्ड प्लेटफॉर्म के माध्यम से मुफ्त में वान 2.2 की कोशिश करने का भी अवसर है, जो मॉडल की क्षमताओं के साथ प्रयोग करने के लिए एक ऑनलाइन इंटरफ़ेस प्रदान करता है।

अब विज़ार्ड पर वान 2.2 के साथ शुरू करें!