हिंदी
बेंगलुरु की सर्वम AI ने अपने सॉवरेन AI मॉडल, सर्वम विज़न के साथ OCR बेंचमार्क में ChatGPT और गूगल जेमिनी को पीछे छोड़ दिया है। बुलबुल V3 के साथ, भारतीय भाषाओं में AI वॉयस टेक्नोलॉजी को भी नई पहचान मिल रही है।


अब तक आर्टिफिशियल इंटेलिजेंस की दुनिया पर अमेरिका और चीन का दबदबा रहा है। भारत को अक्सर सिर्फ़ एक टैलेंट हब के तौर पर देखा जाता था, न कि कोर AI डेवलपमेंट के सेंटर के तौर पर। लेकिन बेंगलुरु स्थित स्टार्टअप Sarvam AI इस सोच को तेज़ी से बदल रहा है। भारत में पूरी तरह से डेवलप किए गए अपने सॉवरेन AI मॉडल के ज़रिए, Sarvam AI अब सीधे तौर पर ग्लोबल टेक दिग्गजों को चुनौती दे रहा है। (Img Source: Google)



Sarvam AI के दो टूल फिलहाल टेक दुनिया में चर्चा का विषय बने हुए हैं-Sarvam Vision और Sarvam Vision। Sarvam Vision एक एडवांस्ड OCR (ऑप्टिकल कैरेक्टर रिकग्निशन) आधारित AI मॉडल है जिसने कई अहम बेंचमार्क पर ChatGPT, गूगल जेमिनी और एंथ्रोपिक क्लॉड जैसे बड़े प्लेयर्स को पीछे छोड़ दिया है। इसकी सटीकता और मुश्किल डॉक्यूमेंट्स को समझने की क्षमता ने AI एक्सपर्ट्स का ध्यान खींचा है। (Img Source: Google)



Sarvam AI के को-फाउंडर प्रत्युष कुमार ने सोशल मीडिया प्लेटफॉर्म X पर इन उपलब्धियों की डिटेल्स शेयर कीं। कंपनी के मुताबिक, Sarvam Vision ने olmOCR-Bench पर 84.3% सटीकता हासिल की, जो Gemini 3 Pro और DeepSeek OCR v2 जैसे मॉडल से ज़्यादा है। इस बेंचमार्क पर ChatGPT का स्कोर काफी कम था। (Img Source: Google)



इसके अलावा Sarvam Vision ने OmniDocBench v1.5 पर 93.28% का शानदार स्कोर हासिल किया। खास बात यह है कि मुश्किल लेआउट, टेक्निकल टेबल, स्कैन किए गए डॉक्यूमेंट्स और मैथमेटिकल फॉर्मूले जैसे चुनौतीपूर्ण क्षेत्रों में भी इसका परफॉर्मेंस बहुत अच्छा रहा, जहां पारंपरिक OCR सिस्टम अक्सर फेल हो जाते हैं। (Img Source: Google)



शुरुआत में, Sarvam AI को एक ऐसी कंपनी के तौर पर देखा जाता था जो सिर्फ़ भारतीय भाषाओं के मॉडल पर फोकस करती थी, और कई लोगों ने ग्लोबल लेवल पर मुकाबला करने की इसकी क्षमता पर सवाल उठाए थे। लेकिन अब, वह शक तारीफ़ में बदल रहा है। कई टेक कमेंटेटर्स और यूज़र्स का मानना है कि Sarvam AI ने भारतीय भाषाओं और स्थानीय ज़रूरतों के लिए जिस लेवल का AI डेवलप किया है, उससे ग्लोबल कंपनियां भी सीख सकती हैं। (Img Source: Google)



यूज़र फीडबैक भी बहुत अच्छा रहा है। कई यूज़र्स ने Sarvam Vision का इस्तेमाल करने के बाद इसकी स्पीड, सटीकता और भारतीय डॉक्यूमेंट्स को समझने की क्षमता के लिए खुले तौर पर तारीफ़ की है। (Img Source: Google)



OCR के साथ-साथ, Sarvam AI ने अपना नया टेक्स्ट-टू-स्पीच मॉडल, Bulbul V3 भी लॉन्च किया है। यह मॉडल भारतीय भाषाओं में नैचुरल और एक्सप्रेसिव आवाज़ें बनाने पर फोकस करता है। इसका कॉन्सेप्ट ElevenLabs जैसे इंटरनेशनल AI वॉयस प्लेटफॉर्म जैसा ही है, लेकिन इसे पूरी तरह से भारत की ज़रूरतों को पूरा करने के लिए डिज़ाइन किया गया है। (Img Source: Google)



अभी, Bulbul V3 11 भारतीय भाषाओं में 35 से ज़्यादा आवाज़ें देता है। कंपनी जल्द ही इसे 22 भारतीय भाषाओं तक बढ़ाने की योजना बना रही है, जिससे सरकार, शिक्षा, मीडिया और कस्टमर सपोर्ट जैसे सेक्टर्स को बहुत फायदा होगा। (Img Source: Google)



Sarvam AI की सफलता यह दिखाती है कि भारत अब सिर्फ़ AI यूज़र या टैलेंट सप्लायर नहीं रहा, बल्कि कोर AI इनोवेशन के लिए एक मज़बूत हब बन रहा है। सॉवरेन AI मॉडल, लोकल भाषाओं पर फोकस और ग्लोबल बेंचमार्क के मुकाबले मज़बूत परफॉर्मेंस भारत को AI रेस में एक नई पहचान दे रहे हैं। (Img Source: Google)
