AI में हिंदी बोलना क्यों पड़ रहा भारी, रिसर्च में हुआ बड़ा खुलासा

रिपोर्ट में खुलासा हुआ है कि हिंदी में एआई यूज करने पर इंग्लिश की तुलना में 1.5 से 3.3 गुना ज्यादा टोकन खर्च होते हैं। इससे हिंदी यूजर्स के लिए एआई इस्तेमाल करना महंगा पड़ रहा है। इसे ‘लैंग्वेज टैक्स’ कहा जा रहा है जो टोकनाइजेशन से जुड़ा है।

Updated : 23 June 2026, 4:11 PM IST

AI में हिंदी बोलना क्यों पड़ रहा भारी, रिसर्च में हुआ बड़ा खुलासा

प्रतीकात्मक छवि (फोटो सोर्स- Pinterest)

New Delhi: हाल ही में सामने आई एक रिपोर्ट में यह दावा किया गया है कि हिंदी में एआई का उपयोग करना इंग्लिश के मुकाबले काफी महंगा पड़ रहा है। डेटा के अनुसार, हिंदी भाषा में एआई को इस्तेमाल करने पर इंग्लिश की तुलना में लगभग 1.5 गुना से लेकर 3.3 गुना तक अधिक टोकन खर्च करने पड़ते हैं। इसका सीधा असर यह होता है कि हिंदी यूजर्स के लिए एआई का इस्तेमाल अपेक्षाकृत ज्यादा लागत वाला हो जाता है।

भले ही OpenAI, Anthropic और Google जैसी बड़ी कंपनियां अपने एआई मॉडल्स को सभी भाषाओं के लिए समान एक्सेस देने की बात करती हैं, लेकिन व्यवहारिक रूप से स्थिति अलग दिखाई देती है।

टोकन क्या है और लागत क्यों बढ़ती है?

एआई मॉडल किसी भी टेक्स्ट को समझने से पहले उसे छोटे-छोटे हिस्सों में तोड़ता है, जिन्हें टोकन कहा जाता है। यह प्रक्रिया एक टोकनाइजर के जरिए होती है। हर एआई क्वेरी की लागत इन टोकनों की संख्या पर निर्भर करती है।

इसी वजह से जब कोई यूजर हिंदी में सवाल पूछता है, तो उसी बात को समझने और प्रोसेस करने के लिए एआई को इंग्लिश की तुलना में ज्यादा टोकन की जरूरत पड़ती है। नतीजा यह होता है कि हिंदी में वही काम करने पर लागत बढ़ जाती है।

Artificial Intelligence: कृत्रिम मेधा के प्रयोग से किसानों की बदलेगी किस्मत, कृषि क्षेत्र को मिलेगी नई ऊंचाई, पढ़ें ये खास रिपोर्ट

रिसर्च में सामने आए चौंकाने वाले आंकड़े

OpenAI के रिसर्चर Aran Komatsuzaki द्वारा किए गए एक प्रयोग में यह तुलना की गई कि अलग-अलग भाषाओं के टेक्स्ट को एआई मॉडल कैसे टोकन में बदलते हैं।

इस रिसर्च में पाया गया कि-

OpenAI के मॉडल में हिंदी टेक्स्ट को इंग्लिश के मुकाबले लगभग 1.37 गुना अधिक टोकन लगे
Anthropic के Claude मॉडल में यह अंतर और ज्यादा था, जहां हिंदी को 3.24 गुना अधिक टोकन की जरूरत पड़ी
अरबी भाषा के लिए यह आंकड़ा 2.86 गुना रहा
चीनी भाषा के लिए लगभग 1.71 गुना अधिक टोकन लगे

इन आंकड़ों से साफ है कि इंग्लिश के अलावा अन्य भाषाओं में एआई उपयोग करना अधिक संसाधन खर्च करता है।

‘लैंग्वेज टैक्स’ क्या है?

विशेषज्ञ इस पूरे अंतर को “लैंग्वेज टैक्स” कह रहे हैं। इसका मतलब है कि अलग-अलग भाषाओं में एआई का उपयोग करने पर एक तरह की छिपी हुई अतिरिक्त लागत लगती है।

यह टैक्स कोई अलग से लिया जाने वाला शुल्क नहीं है, बल्कि यह टोकनाइजेशन प्रक्रिया के कारण पैदा होने वाली लागत है। यानी जो काम इंग्लिश में कम टोकन में हो जाता है, वही हिंदी या अन्य भाषाओं में अधिक टोकन मांगता है।

Artificial Intelligence: क्या आपको पता है कृत्रिम बुद्धिमत्ता से जुड़ी ये बातें, आपकी भी होती है निगरानी, पढ़ें ये रिपोर्ट

इस अंतर के पीछे की मुख्य वजह

जानकारों के अनुसार, इसका सबसे बड़ा कारण यह है कि अधिकांश एआई मॉडल मुख्य रूप से इंग्लिश डेटा पर ट्रेन किए गए हैं। इसलिए वे इंग्लिश टेक्स्ट को आसानी से और कम टोकनों में प्रोसेस कर लेते हैं।

वहीं हिंदी, अरबी और अन्य भाषाओं के लिए मॉडल को टेक्स्ट को अलग-अलग स्क्रिप्ट और संरचना में तोड़ना पड़ता है, जिससे टोकन की संख्या बढ़ जाती है।

क्या है समाधान?

विशेषज्ञों का मानना है कि इस समस्या से निपटने के लिए एआई कंपनियों को अलग-अलग भाषाओं पर अधिक ध्यान देना होगा और उन्हें समान रूप से ट्रेन करना होगा। अगर मॉडल्स को बहुभाषी डेटा पर बेहतर तरीके से प्रशिक्षित किया जाए, तो लागत में यह अंतर कम किया जा सकता है।

Location : New Delhi

Published : 23 June 2026, 4:11 PM IST

Topics : AI Cost Artificial Intelligence Hindi AI Language Tax openAI

Follow Dynamite News WhatsApp Channel

Related News

Google को लगा बड़ा झटका! Gemini AI के सबसे बड़े दिमाग ने छोड़ा साथ, अब OpenAI में मचाएंगे धमाल

AI से बढ़ते खतरे को रोकने के लिए RBI और वित्त मंत्रालय का बड़ा कदम! अब AI बनेगा ही हथियार

Meta में 8000 नौकरियां खत्म! AI के लिए मार्क जुकरबर्ग का सबसे बड़ा दांव, कर्मचारियों में डर

लेटेस्ट न्यूज़

मोहर्रम को लेकर बरेली रेंज में हाई अलर्ट, 1384 जुलूसों की निगरानी के लिए 55 जोन और 202 सेक्टर बनाए गए

Fire Tragedy: जिस कोचिंग में बच्चे बना रहे हैं भविष्य, वहां की सुरक्षा जानकर चौंक जाएंगे आप भी

लखनऊ हादसे के बाद मैनपुरी में हाई अलर्ट… होटल और कोचिंग सेंटरों पर प्रशासन की छापेमारी

CJP Protest: महाराष्ट्र से जंतर मंतर पहुंची बेबस मां, महिला ने सुनाई दर्द भरी कहानी, अड़ी एक जिद पर

Love Lust: शादी के बाद खुला पति की पहचान का राज, कई मर्दों से बनाए संबंध; जानिये राहुल और अंसार अली की अबूझ पहेली

Lucknow Fire Tragedy: अलीगंज अग्निकांड की लपटें अलीगढ़ तक, शिक्षा विभाग की टूटी नींद, ताबड़तोड़ सीलबंदी

Weather Update: उत्तर प्रदेश में आज की ‘झमाझम’ के बाद कल इन 10 जिलों में मचेगी तबाही!

जिसे दोस्त समझकर साथ गया, वही बन गए मौत के सौदागर… यूकेलिप्टस के बाग में रची गई खौफनाक साजिश

टेक & साइंस

Chrome से हो गए बोर? तो ये 4 Web Browser Apps जरूर करें ट्राई, जानिए कौन सा है आपके लिए बेस्ट

Smartphone Buying Tips: 2026 में नया फोन खरीदते समय 8GB और 12GB RAM में से किसे चुनें, यहां समझें पूरा गणित

स्मार्टफोन कंपनियों की छुट्टी! 800 रुपये से भी कम है इस फोन की कीमत, फीचर्स जानकर उड़ जाएंगे होश!

Tecno Camon Slim की लॉन्च डेट करीब, टीजर्स में सामने आया स्लिम डिजाइन और दमदार फीचर्स

iPhone Air 2 में होने जा रहे हैं बड़े बदलाव, कैमरा और बैटरी अपग्रेड जानकर चौंक जाएंगे यूजर्स

मनोरंजन न्यूज़

see all

‘मिर्जापुर: द मूवी’ से पहले मेकर्स का सरप्राइज वीडियो, क्या अमेरिका तक पहुंचेगा गुड्डू भैया का भौकाल?

बरेली एयरपोर्ट पर अचानक उतरे बॉलीवुड के तीन बड़े सितारे… 5 मिनट बाद जो हुआ, सब रह गए हैरान

Patna: बॉलीवुड अभिनेता पंकज त्रिपाठी के भाई पर कातिलाना हमला: धारदार हथियार से किया वार, पटना रेफर

“…मुझे बदनाम किया गया”, सोशल मीडिया के भद्दे कमेंट्स पर हरियाणवी डांसर Dimple Chaudhary ने ट्रोलर्स को दिया मुंहतोड़ जवाब

Father’s Day 2026: पिता धर्मेंद्र के बिना पहला फादर्स डे, आधी रात एशा देओल ने शेयर की ऐसी तस्वीर कि रो पड़ा बॉलीवुड!

उत्तर प्रदेश न्यूज़

see all