पिछले साल इस बार, सोशल मीडिया MyHeritage के वायरल “डीप नॉस्टेल्जिया” से जगमगा रहा था, जिसका AI जादू हमारे पुराने पारिवारिक फ़ोटो को परेशान करने वाले यथार्थवाद के साथ एनिमेट करता है। ठीक है, अगर आप इससे परेशान हो जाते हैं, तब तक प्रतीक्षा करें जब तक कि आप उस नई सुविधा को न देख लें जिसे मैंने अभी कॉल किया था लाइवस्टोरी.
इस बार, एक ऑनलाइन वंशावली कंपनी की तकनीक आपके रिश्तेदार की पुरानी तस्वीर के आधार पर 10-20 क्लिप की एक छोटी क्लिप नहीं बना रही है। इसके बजाय, लाइवस्टोरी आपके पूर्वज का एक लंबा एनिमेटेड वीडियो बनाकर आगे बढ़ता है जो उसके पूरे जीवन की कहानी कहता है, लिप-सिंक ऑडियो और पुरानी तस्वीरों के स्लाइड शो के साथ पूरा होता है।
पहले की तरह, यह एआई-पावर्ड “री-एक्टमेंट” तकनीक का उपयोग करके काम करता है जो आपके रिश्तेदार के चेहरे की एक छवि को एनिमेट करता है। लेकिन इस बार आपको एक आवाज भी मिलती है जो MyHeritage परिवार के पेड़ से स्वतः उत्पन्न होती है या आपके द्वारा मैन्युअल रूप से दर्ज की जाती है। फिर टेक्स्ट-टू-स्पीच तकनीक कहानी को जीवंत करती है और आवाज आपके रिश्तेदार के चलते वक्ता के साथ तालमेल बिठाती है।
यह काम किस प्रकार करता है?
पिछले साल की “डीप नॉस्टेल्जिया” तकनीक की तरह, लाइवस्टोरी के एनिमेशन “ड्राइवर वीडियो” के एक बड़े संग्रह का उपयोग करके बनाए गए हैं। एक बार जब सेवा के एल्गोरिदम आपके द्वारा अपलोड की गई छवि का विश्लेषण करते हैं, तो इसकी मुख्य विशेषताएं, या चेहरे की “विशेषताएं”, फिर आंदोलन की छाप बनाने के लिए ड्राइवर के वीडियो में मैप की जाती हैं। एल्गोरिदम किसी भी लापता विवरण को भी भरते हैं। सिंथेटिक वॉयस जनरेटर भी व्यक्ति की प्रोफ़ाइल में जानकारी के आधार पर एक कथन बनाता है, या आप स्क्रैच से अपनी स्क्रिप्ट बना सकते हैं। आप अपनी खुद की ऑडियो रिकॉर्डिंग भी अपलोड कर सकते हैं।
MyHeritage और D-ID, इज़राइली कंपनी जो तकनीक बनाती और लाइसेंस देती है, कहती है कि अंतिम परिणाम पूरी तरह से अनुकूलन योग्य है, जो आपको परिवार या सोशल मीडिया पर भेजने से पहले कथन, चित्र और ऑडियो को बदलने की क्षमता देता है। लाइवस्टोरी कई पुरुष और महिला आवाज विकल्पों के साथ 31 भाषाओं, दर्जनों बोलियों और सैकड़ों आवाज पात्रों का समर्थन करती प्रतीत होती है।
इन सबके बावजूद, इसमें कोई संदेह नहीं है कि तकनीक थोड़ी डरावनी है और हमें अलौकिक घाटी में और भी बड़ी यात्रा पर ले जाती है। कुछ लोगों के लिए, ऑडियो जोड़ने से चीज़ें बहुत आगे निकल सकती हैं, और MyHeritage को यह सुनिश्चित करने के लिए कुछ अस्वीकरण जोड़ना पड़ा कि तकनीक का दुरुपयोग नहीं हो रहा है। यह कहता है कि लाइवस्टोरी “केवल मृत व्यक्तियों, आमतौर पर किसी के पूर्वजों की तस्वीरों पर उपयोग करने का इरादा है” और यह कि “उनकी अनुमति के बिना किसी जीवित व्यक्ति की तस्वीर पर कभी भी इसका उपयोग नहीं किया जाना चाहिए।”
हालांकि, सोशल मीडिया पर कई लोगों ने पाया कि पिछले साल की “डीप नॉस्टेल्जिया” तकनीक उन रिश्तों को “मिलने” का एक सुकून देने वाला या दिल को छू लेने वाला तरीका था जो उन्होंने वास्तविक जीवन में कभी नहीं देखे थे। उस सुविधा की तरह, लाइवस्टोरी वर्तमान में डेस्कटॉप और मोबाइल वेब पर मुफ़्त में आज़माने के लिए उपलब्ध है (दोनों के माध्यम से MyHeritage साइट) और MyHeritage मोबाइल ऐप में। आप कई लाइवस्टोरी मुफ्त में बना सकते हैं, लेकिन उसके बाद आपको सदस्यता के लिए भुगतान करना होगा (प्रति वर्ष $119 / £89 से)।
विश्लेषण: अलौकिक घाटी में एक साहसिक कदम
पिछले साल के “डीप नॉस्टेल्जिया” की तरह, हम MyHeritage की नई “LiveStory” सुविधा के बारे में थोड़ा फटे हुए हैं। इसमें कोई संदेह नहीं है कि तकनीक महान है, और यह तथ्य कि यह स्वचालित रूप से एक फोटो, परिवार के पेड़ से 90-सेकंड का वीडियो बायो उत्पन्न कर सकता है, और कुछ पाठ प्रभावशाली और भयानक दोनों हैं।
हालांकि, हम मदद नहीं कर सकते लेकिन महसूस करते हैं कि तकनीक की पिछली वायरल सफलता का एक बड़ा हिस्सा (जिसके परिणामस्वरूप 100 मिलियन एनिमेशन हुए) इसकी सटीकता के कारण है। डीप नॉस्टेल्जिया ने जो चलते हुए चेहरे पैदा किए, वे कभी-कभी झपकाते या सिर झुकाते थे, लेकिन ऐसा ही था – और इस प्रतिबंध ने तकनीक की सीमाओं को छुपाते हुए एक भ्रम पैदा करने में मदद की।
ध्वनि जोड़ना एक तार्किक कदम है, और निस्संदेह उन लोगों के लिए एक लोकप्रिय उपकरण साबित होगा, जिन्हें निर्विवाद रेंगने वाले कारक से ठंड नहीं लगती है। लेकिन अब तक हमने जो उदाहरण देखे हैं, उनमें से इंटोनेशन कभी-कभी स्वचालित होता है और यह तथ्य कि ध्वनि का नमूना मूल से नहीं लिया जाता है, इसे कुछ हद तक कृत्रिम बनाता है।
वर्तमान में, लाइवस्टोरी संग्रहालयों या शिक्षा के लिए अधिक उपयुक्त प्रतीत होती है, जहां ऐतिहासिक आंकड़ों (व्यक्तिगत संबंधों के बजाय) को जीवंत करने की इसकी क्षमता आगंतुकों और बच्चों के लिए इतिहास को और अधिक आकर्षक बनाने का एक उपयोगी तरीका हो सकता है।
बेशक, दुरुपयोग की भी संभावना है, हालांकि डी-आईडी (प्रौद्योगिकी के निर्माता) ने ऐसा होने से रोकने के लिए कुछ बाधाएं रखी हैं। लाइवस्टोरी बनाने से पहले सभी उपयोगकर्ताओं को शर्तों को स्वीकार करने की आवश्यकता है, जिसमें एक वादा भी शामिल है कि वे जीवित लोगों पर इसका उपयोग नहीं करेंगे। आपत्तिजनक, मानहानिकारक या झूठी जानकारी की जांच के लिए बोर्ड पर एक टेक्स्ट-संशोधन एल्गोरिदम भी है, हालांकि यह स्पष्ट नहीं है कि बाद की जांच कैसे की जाती है।
कब हमने पिछले साल एक विशेष साक्षात्कार में डी-आईडी से बात की थीहम यह सुनिश्चित करने की उसकी प्रतिबद्धता से प्रभावित हैं कि उसकी एआई तकनीक का उपयोग नापाक तरीकों से नहीं किया जाता है, अगर उसकी भविष्यवाणी से थोड़ा नाराज भी है कि हम ऑनलाइन देखे जाने वाले अधिकांश दृश्य मीडिया “5-10 वर्षों के भीतर” सिंथेटिक हो जाएंगे। लाइवस्टोरी स्पष्ट रूप से लाइन पर एक और कदम है। यह ट्रैक, यदि चाल नहीं है, तो वायरल स्मैश है जो पिछले साल “गहरी उदासीनता” थी।