ByteDance नाम तो सुना होगा? अगर नहीं, तो आपने चाइनीज सोशल मीडिया ऐप Tiktok के बारे में जरूर सुना होगा? Tiktok की पैरेंट कंपनी ByteDance है। इसी ByteDance ने एक ऐसा एआई मॉडल बनाया है, जिसने पूरी दुनिया को क्रेजी कर दिया है। इसका नाम है – OmniHuman-1 मल्टीमॉडल मॉडल. यह मल्टीमॉडल आपकी सिंगल फोटो और ऑडियो को हाईपर रियलिस्टिक वीडियो में बदल देगा। मतलब आप देखकर पहचान नहीं पाएंगे कि यह वीडियो रियल है या नहीं। TikTok ने इस नए टूल से एक बार फिर दुनिया को सोचने पर मजबूर कर दिया है। यह एआई मॉडल पूरी दुनिया में चर्चा की वजह बना हुआ है। इससे पहले चीन के deepSeek ने पूरी दुनिया को क्रेजी कर दिया था।
फोटो से तैयार कर सकता है वीडियो भाषण
हालांकि OmniHuman-1 मॉडल ने डीपफेक की भी चर्चा छेड़ दी है। दरअसल ऐसा दावा किया जा रहा है कि इस टूल की मदद से किसी के फोटो को वीडियो में बदलकर कोई भी ऑडियो चलाया जा सकेगा, जो आम लोग पहचान नहीं पाएंगे। बाइटडांस का नया एआई मॉडल वीडियो में चेहरे के भाव और हरकतों को बिल्कुल रियल तरीके से दिखाता है। यह किसी की फोटो की मदद से वीडियो भाषण और गीत तैयार कर सकता है।
क्या है डेटा मिक्सिंग टेक्नोलॉजी
ByteDance की मानें, तो फोटो से वीडियो बनाने के लिए डेटा मिक्सिंग टेक्नोलॉजी की जरूरत होती है, जो फेसियल एक्सप्रेशन से रियलिस्टिक वीडियो बनाता है। यह पूरी बॉडी का क्लोजअप फेसियल एक्सप्रेशन लेता है। इसकी तरफ से बनाए गए वीडियो क्लिप के जेस्चर, लिप मूवमेंट और एक्सप्रेशन बिल्कुल रियल लगते हैं। कंपनी का मानना है कि यह वर्चुअल एंटरटेनमेंट और एजूकेशन के नए रास्ते खोल सकता है।
चीन और अमेरिकी एआई रेस
ByteDance ने अपना एआई मॉडल ऐसे वक्त में पेश किया है, जब ग्लोबली एआई रेस जारी है। चीन और अमेरिका के बीच एआई रेस का दौर चल रहा है। ऐसे दौर में ByteDance ने नया OmniHuman-A मॉडल पेश कर दिया है, जिसे एआई में चीन के बढ़ते प्रभाव से जोड़कर देखा जा रहा है।
