Ai का अगला कदम हो सकता है Text-to-Video,चैटजीपीटी से कितना होगा अलग

Sudhir Mishra April 2, 2023

0 14 1 minute read

नई दिल्ली। अपनी शुरुआत के साथ से ही ChatGPT ने काफी शौहरत कमाई है। जब जेनेरेटिव एआई की बात आती है, तो आज चैटजीपीटी का नाम सबसे ऊपर आता है। हालांकि, चैटजीपीटी जैसे भाषा मॉडल से परे जनरेटिव की दुनिया में और भी बहुत कुछ मिलता है। बता दें कि टेक्स्ट-टू-इमेज पहले से ही मुख्यधारा की बातचीत का हिस्सा बन रहा है, लेकिन बैकग्राउंड में जेनेरेटिव एआई एक ऐसा टूल है, जो टेक्स्ट को वीडियो में बदलने में सक्षम है। आइये इसके बारे में जातने हैं।

क्या है टेक्स्ट-टू-वीडियो AI?

जैसे कि हम जानते हैं कि AI अब कुछ भी करने में सक्षम है। ऐसे में अगर आप टेक्स्ट-टू-वीडियो AI को समझना चाहते हैं तो जानना होगा कि जनरेटिव AI कैसे काम करती है। इसकी मदद से आप केवल अपने शब्दों के आधार पर एआई-संचालित वीडियो उत्पन्न कर सकते हैं।। यूएस-आधारित स्टार्टअप रनवे ने अपने जेन-2 मॉडल का प्रदर्शन किया, जो एक या दो कैविएट के साथ ऐसा करने में सक्षम है।

बड़ी कंपनियां कर रही है काम

बता दें कि बड़ी कंपनियां भी इसका हिस्सा है। सितंबर 2022 में मेटा ने टूल मेक-ए-वीडियो का प्रदर्शन किया, जो केवल कुछ शब्दों या टेक्स्ट की पंक्तियों के साथ, मेक-ए-वीडियो जनरेटिव एआई का उपयोग करके वीडियो बनाता है, लेकिन उन वीडियो में कोई आवाज नहीं होती है।

मेटा के सीईओ मार्क जुकरबर्ग ने इसके बारे में क्या कहा था कि फोटो की तुलना में वीडियो बनाना बहुत कठिन है, क्योंकि प्रत्येक पिक्सेल को सही ढंग से जनरेट करने से परे, सिस्टम को यह भी अनुमान लगाना होगा कि वे समय के साथ कैसे बदलेंगे।

इसके ठीक एक सप्ताह के अंदर Google ने एक ऐसे ही मॉडल की घोषणा की। Google के जनरेटिव AI मॉडल को Imagen Video कहा जाता है। ये टेक्स्ट प्रॉम्प्ट दिए जाने पर, इमेजन वीडियो बेस वीडियो जनरेशन मॉडल और इंटरलीव्ड स्थानिक और अस्थायी वीडियो सुपर-रिजाल्यूशन मॉडल का उपयोग करके हाई डेफिनिशन वीडियो उत्पन्न करता है। इसके अलावा Google ने फेनाकी नामक एक अन्य मॉडल भी पेश किया, जिसका उद्देश्य टेक्स्ट इनपुट के आधार पर लंबे-चौड़े वीडियो बनाना है।