AI के कामों देख कर क्यों परेशान है क्रिएटिव कलाकार, पढ़ें ये रिपोर्ट

डीएन ब्यूरो

कृत्रिम बुद्धिमत्ता (एआई) का उपयोग कला के क्षेत्र में किया जाना कोई नई बात नहीं है। यह एआई जितना ही पुराना है। पढ़िये पूरी खबर डाइनामाइट न्यूज़ पर

फाइल फोटो
फाइल फोटो


न्यू जर्सी (अमेरिका): कृत्रिम बुद्धिमत्ता (एआई) का उपयोग कला के क्षेत्र में किया जाना कोई नई बात नहीं है। यह एआई जितना ही पुराना है।

इसमें नया पहलू यह है कि कई नए तरीके के उपकरण (टूल) आने से ‘टेक्स्ट प्रॉम्प्ट’ (संकेत के लिए कोई शब्द या वाक्य लिखना) के जरिए अधिकतर लोग तस्वीरें बना रहे हैं।

इसके लिए आपको बस एक ‘टेक्स्ट बॉक्स’ में लिखना है ‘‘वैन गॉग (डच चित्रकार) की शैली का एक परिदृश्य’’ और एआई इसके अनुसार एक सुंदर तस्वीर पेश कर देगा।

इस तकनीक का बेहतर इस्तेमाल मानव भाषा के सही इस्तेमाल में निहित है... लेकिन क्या ये प्रणालियां किसी कलाकार के दृष्टिकोण को सटीक रूप दे सकती हैं? क्या भाषा को कला-निर्माण में लाने से वास्तव में कलात्मक सफलताएं मिल सकती हैं?

मैंने वर्षों तक एक कलाकार और कंप्यूटर वैज्ञानिक के रूप में ‘जेनरेटिव एआई’ के साथ काम किया है और मैं कहूंगा कि यह नए प्रकार का उपकरण रचनात्मक प्रक्रिया को बाधित करता है। जब एआई से छवि बनाने के लिए ‘टेक्स्ट प्रॉम्प्ट’ लिखते हैं तो असीमित संभावनाएं होती हैं।

अगर आप आम उपयोगकर्ता हैं तो आपको एआई द्वारा बनाई गई हर तस्वीर अच्छी लगेगी।

स्टार्टअप और निवेशकों ने इस तकनीक में अरबों का निवेश किया है। इसे लेखों, वीडियो गेम पात्रों और विज्ञापनों के लिए ‘ग्राफिक्स’ बनाने का एक आसान तरीका माना जाता है।

इसके विपरीत एक कलाकार को एक उच्च गुणवत्ता वाली छवि बनाने के लिए बड़ा निबंध जैसा संदेश लिखने की जरूरत हो सकती है, जिससे की छवि की रचना और उसका रूप उनके दृष्टिकोण के अनुरूप हो।

लंबा संदेश आवश्यक रूप से छवि का वर्णन करने वाला हो ऐसा जरूर नहीं है। इसमें आमतौर पर कलाकार के दिमाग में क्या है, इसको स्पष्ट रूप से जाहिर करने के लिए कई ‘कीवर्ड’ का इस्तेमाल किया जाता है। इसके लिए एक अपेक्षाकृत नया शब्द ‘प्रॉम्प्ट इंजीनियरिंग’ है।

मूल रूप से इन उपकरणों का उपयोग करने वाले कलाकार की भूमिका ‘रिवर्स-इंजीनियरिंग’ तक सीमित हो जाती है जिसमें वांछित परिणाम पाने के लिए सही ‘कीवर्ड’ तलाशने की जरूरत होती है। सही शब्द ढूंढ़ने के लिए कई प्रयास तथा कई परीक्षण की जरूरत होती है।

एआई उतना बुद्धिमान नहीं है जितना लगता है-

परिणाम को बेहतर ढंग से नियंत्रित करने का तरीका जानने के लिए यह जानना महत्वपूर्ण है कि इनमें से अधिकतर प्रणालियां इंटरनेट पर मौजूद छवियों और ‘कैप्शन’ (तस्वीर संबंधी जानकारी) के जरिए काम करती हैं।

आप इस तरह सोचें कि एक सामान्य छवि का ‘कैप्शन’ किसी छवि के बारे में क्या बताता है। ‘कैप्शन’ आमतौर पर वेब ब्राउज़िंग में छवि को बेहतर तरीके से समझने के लिए लिखे जाते हैं। उदाहरण के लिए ‘कैप्शन’ में छायाकार और कॉपीराइट धारक के नाम की जानकारी दी जा सकती है।

‘फ़्लिकर’ जैसी कुछ वेबसाइट पर कैप्शन में आमतौर पर कैमरे के प्रकार और उपयोग किए गए लेंस की जानकारी दी जाती है। अन्य साइट पर ‘कैप्शन’ किसी छवि को प्रस्तुत करने के लिए इस्तेमाल किए गए ग्राफिक इंजन और हार्डवेयर का वर्णन हो सकता है।

इसलिए एक सही ‘टेक्स्ट प्रॉम्प्ट’ लिखने के लिए उपयोगकर्ताओं को संबंधित छवि बनाने के लिए एआई प्रणाली में कई ऐसे ‘कीवर्ड’ भी डालने पड़ते हैं, जो उससे सीधे तौर पर संबंधित न हो।

नियंत्रण की कमी से कलाकार निराश-

क्या यह वास्तव में उस प्रकार का उपकरण है जो कलाकारों को बेहतरीन काम करने में मदद कर सकता है?

मैंने ‘प्लेफॉर्म एआई’ में ‘जनरेटिव एआई’ कला मंच की स्थापना की, हमने ‘जनरेटिव एआई’ के साथ कलाकारों के अनुभवों को बेहतर ढंग से समझने के लिए एक सर्वेक्षण किया।

हमने 500 से अधिक डिजिटल कलाकारों, पारंपरिक चित्रकारों, छायाकारों, चित्रकारों और ग्राफिक डिजाइनरों की राय जानी जिन्होंने ‘डीएएलएल-ई’, ‘स्टेबल डिफ्यूजन’ और ‘मिडजर्नी’ जैसे मंचों का इस्तेमाल किया था।

इनमें से केवल 46 प्रतिशत ने ऐसे उपकरणों को ‘‘बहुत उपयोगी’’ बताया, जबकि 32 प्रतिशत ने उन्हें कुछ हद तक फायदेमंद बताया। हालांकि वे इसके परिणाम को अपने काम में शामिल नहीं कर सके। अन्य 22 प्रतिशत ने इन मंचों को बिल्कुल भी उपयोगी नहीं पाया।

कलाकारों और डिजाइनर ने नियंत्रण की कमी को सबसे बड़ी बाधा बताया। शून्य से 10 के पैमाने पर... उत्तरदाताओं ने परिणाम को नियंत्रित करने की सीमा चार से पांच के बीच बतायी। करीब आधे लोगों ने नतीजे को दिलचस्प पाया, लेकिन इतनी उच्च गुणवत्ता का नहीं कि उसका इस्तेमाल किया जा सके।

हालांकि इस बात को लेकर भी कई सवाल हैं कि क्या ये सीमाएं मौलिक हैं, या प्रौद्योगिकी में सुधार होते ही ये खत्म हो जाएंगी?

बेशक ‘जेनरेटिव एआई’ के नए संस्करण उपयोगकर्ताओं को उच्च रिजॉल्यूशन और बेहतर छवि गुणवत्ता के साथ बेहतर परिणाम देंगे।

‘टेक्स्ट-टू-इमेज’ तकनीक में एक और बुनियादी सीमा है। यदि दो कलाकार बिल्कुल एक ही संदेश लिखें तो यह बहुत कम संभावना है कि प्रणाली परिणाम में एक ही छवि दिखाए।

हमने जिन कलाकारों को सर्वेक्षण में शामिल किया, उनमें से करीब दो-तिहाई ने इस बात को लेकर चिंता जाहिर की कि एआई द्वारा निर्मित तस्वीर अन्य कलाकारों के कार्यों के समान हो सकती है और तकनीक उनकी पहचान को प्रतिबिंबित नहीं करती।










संबंधित समाचार