Ai का अगला कदम हो सकता है Text-to-Video,चैटजीपीटी से कितना होगा अलग

नई दिल्ली। अपनी शुरुआत के साथ से ही ChatGPT ने काफी शौहरत कमाई है। जब जेनेरेटिव एआई की बात आती है, तो आज चैटजीपीटी का नाम सबसे ऊपर आता है। हालांकि, चैटजीपीटी जैसे भाषा मॉडल से परे जनरेटिव की दुनिया में और भी बहुत कुछ मिलता है। बता दें कि टेक्स्ट-टू-इमेज पहले से ही मुख्यधारा की बातचीत का हिस्सा बन रहा है, लेकिन बैकग्राउंड में जेनेरेटिव एआई एक ऐसा टूल है, जो टेक्स्ट को वीडियो में बदलने में सक्षम है। आइये इसके बारे में जातने हैं।
क्या है टेक्स्ट-टू-वीडियो AI?
जैसे कि हम जानते हैं कि AI अब कुछ भी करने में सक्षम है। ऐसे में अगर आप टेक्स्ट-टू-वीडियो AI को समझना चाहते हैं तो जानना होगा कि जनरेटिव AI कैसे काम करती है। इसकी मदद से आप केवल अपने शब्दों के आधार पर एआई-संचालित वीडियो उत्पन्न कर सकते हैं।। यूएस-आधारित स्टार्टअप रनवे ने अपने जेन-2 मॉडल का प्रदर्शन किया, जो एक या दो कैविएट के साथ ऐसा करने में सक्षम है।
बड़ी कंपनियां कर रही है काम
बता दें कि बड़ी कंपनियां भी इसका हिस्सा है। सितंबर 2022 में मेटा ने टूल मेक-ए-वीडियो का प्रदर्शन किया, जो केवल कुछ शब्दों या टेक्स्ट की पंक्तियों के साथ, मेक-ए-वीडियो जनरेटिव एआई का उपयोग करके वीडियो बनाता है, लेकिन उन वीडियो में कोई आवाज नहीं होती है।
मेटा के सीईओ मार्क जुकरबर्ग ने इसके बारे में क्या कहा था कि फोटो की तुलना में वीडियो बनाना बहुत कठिन है, क्योंकि प्रत्येक पिक्सेल को सही ढंग से जनरेट करने से परे, सिस्टम को यह भी अनुमान लगाना होगा कि वे समय के साथ कैसे बदलेंगे।
इसके ठीक एक सप्ताह के अंदर Google ने एक ऐसे ही मॉडल की घोषणा की। Google के जनरेटिव AI मॉडल को Imagen Video कहा जाता है। ये टेक्स्ट प्रॉम्प्ट दिए जाने पर, इमेजन वीडियो बेस वीडियो जनरेशन मॉडल और इंटरलीव्ड स्थानिक और अस्थायी वीडियो सुपर-रिजाल्यूशन मॉडल का उपयोग करके हाई डेफिनिशन वीडियो उत्पन्न करता है। इसके अलावा Google ने फेनाकी नामक एक अन्य मॉडल भी पेश किया, जिसका उद्देश्य टेक्स्ट इनपुट के आधार पर लंबे-चौड़े वीडियो बनाना है।