Google लाया LUMIERE मॉडल, अब टेक्स्ट लिखकर बन जायेगा शानदार वीडियो
टेक्नोलॉजी साझेदारी Google ने LUMIERE AI मॉडल पेश किया है जिसकी मदद से आप टेक्स्ट लिखकर वीडियो बना सकते हैं। कंपनी का नया LUMIERE एक टेक्स्ट-टू-वीडियो और इमेज-टू-वीडियो टेम्पलेट है।
इसका मतलब यह है कि आप न केवल सीधे टेक्स्ट से एक वीडियो बना सकते हैं, बल्कि एक छवि से एक गतिशील वीडियो भी बना सकते हैं। यह टूल कैसे काम करता है इसका एक वीडियो एक्स पर साझा किया गया था। आपकी सुविधा के लिए, हम इसे यहां लेख में जोड़ रहे हैं। इससे आप अच्छे से समझ पाएंगे.
लुमिएरे मॉडल कैसे काम करता है?
पारंपरिक वीडियो मॉडल के विपरीत, Google का नया LUMIERE एक स्पेस-टाइम यू-नेट आर्किटेक्चर को अपनाता है जो एक ही पास में वीडियो की संपूर्ण अस्थायी सीमा (फ्रेम द्वारा संपूर्ण वीडियो) तैयार करता है। यह नवीन तकनीक अस्थायी सुपर-रिज़ॉल्यूशन के बाद दूर के कीफ़्रेम को संश्लेषित करने की आवश्यकता को समाप्त कर देती है, जिससे वैश्विक अस्थायी स्थिरता आसानी से प्राप्त हो जाती है।
शोधकर्ताओं के अनुसार, टेक्स्ट-टू-वीडियो जेनरेशन फ्रेमवर्क को पूर्व-प्रशिक्षित टेक्स्ट-टू-इमेज डिफ्यूजन का उपयोग करके पेश किया गया था। चूंकि मौजूदा तरीके विश्व स्तर पर लगातार गति के साथ संघर्ष करते हैं, टीम ने स्पेस-टाइम यू-नेट आर्किटेक्चर को तैनात करके पूर्ण-फ्रेम वीडियो क्लिप तैयार की है जिसमें स्थानिक और अस्थायी मॉड्यूल शामिल हैं। शोधकर्ताओं की कड़ी मेहनत के कारण इमेज टू वीडियो, वीडियो इनपेंटिंग और स्टाइलाइज्ड जेनरेशन में अच्छे परिणाम प्राप्त हुए हैं।