ठीक है, एक कप कॉफी (या शायद कुछ लॉन्गजिंग चाय, क्योंकि हम चीन की बात कर रहे हैं) लें और चलिए एक रोमांचक विषय में गोता लगाते हैं, जो मध्य साम्राज्य की टेक दुनिया में तेजी से उभर रहा है। एक अमेरिकी के रूप में यहाँ रहते हुए, मैंने कई तकनीकी ट्रेंड्स को आते-जाते देखा है, लेकिन ये कुछ… अलग सा लगता है। ये जमीनी स्तर का है, तकनीकी है, हैरानी की बात ये कि काफी किफायती भी है, और ये जंगल की आग की तरह फैल रहा है।
मैं बात कर रहा हूँ एक ऐसी घटना की, जिसे “शियाओ झी एआई” (小智AI) कहा जाता है, जिसका मतलब तकरीबन “छोटी बुद्धि” या “छोटा चतुर” एआई होता है। और सुनिए: स्थानीय टेक समुदाय की चर्चाओं और रिपोर्ट्स के मुताबिक, इस एआई प्लेटफॉर्म पर चलने वाले हार्डवेयर डिवाइस ने कुछ ही महीनों में 1,00,000 यूनिट की संख्या को पार कर लिया है। ये कोई टाइपिंग मिस्टेक नहीं है। जहाँ वैश्विक टेक दिग्गज चमकदार और महंगे एआई गैजेट्स लॉन्च कर रहे हैं, वहीं ये सादा, अक्सर DIY जैसा दिखने वाला प्रोजेक्ट चुपचाप एक विशाल यूजर बेस बना चुका है, और संभवतः पहला एआई-नेटिव हार्डवेयर इकोसिस्टम बन गया है, जो इतनी जल्दी इस आंकड़े तक पहुँचा है।
चमकदार मार्केटिंग कैंपेन को भूल जाइए; ये चीज पुराने (या नए?) तरीके से वायरल हुई: वायरल वीडियो और मुँह के प्रचार ने इसे बढ़ावा दिया, मुख्य रूप से यूजर्स के उत्साह के दम पर। ये कहानी ओपन सोर्स, सुलभता, और शायद, एआई हार्डवेयर के एक अलग भविष्य की झलक दिखाती है।
शून्य से 1,00,000 तक: वायरल चिंगारी
तो, एक ऐसा प्रोजेक्ट, जो पहले केवल खास डेवलपर समूहों तक सीमित था, अचानक इतने लोगों की कल्पना को कैसे प्रभावित कर गया? आधुनिक चीन की कई चीजों की तरह, इसकी शुरुआत शॉर्ट वीडियो प्लेटफॉर्म्स से हुई। कल्पना कीजिए: आप डौयिन (चीन का टिकटॉक) पर स्क्रॉल कर रहे हैं, और अचानक एक वीडियो पर नजर पड़ती है… जिसमें अक्सर सिर्फ एक नंगा सर्किट बोर्ड होता है। कभी-कभी इसे साधारण 3D-प्रिंटेड बॉक्स में रखा होता है, तो कभी बस टेबल पर खुला पड़ा होता है। कोई उससे बात करता है, सवाल पूछता है, शायद अपने दिन की परेशानियाँ बयान करता है।
और वो बोर्ड जवाब देता है।
सबकी नजर इस बात पर नहीं टिकी कि ये बोलता है, बल्कि कैसे बोलता है, इसने सबको आकर्षित किया। जवाब तेज थे – मुख्यधारा के वॉयस असिस्टेंट्स से कहीं ज्यादा तेज। हम बात कर रहे हैं करीब 300 मिलीसेकंड के रेस्पॉन्स टाइम की, जबकि बाकी में 2-3 सेकंड का इंतजार करना पड़ता है। और सबसे खास बात, आवाज अक्सर बेहद स्वाभाविक लगती थी, कभी-कभी हल्की सिंथेटिक ताइवानी लहजे के साथ, जिसे कई लोगों ने आकर्षक या सुकूनदायक पाया। बातचीत सिर्फ कार्यात्मक नहीं थी; वो… मानवीय लगती थी। यहाँ तक कि संवेदनशील भी। शियाओ झी एआई के वीडियो, जिसमें वो आश्चर्यजनक रूप से गहरी या भावनात्मक रूप से जुड़ने वाली सलाह देता है, सैकड़ों-हजारों, कभी-कभी लाखों लाइक्स बटोर रहे थे।
कमेंट सेक्शन में तहलका मच गया। लोग सिर्फ “कूल टेक!” नहीं कह रहे थे; वो कह रहे थे, “वाह, मैंने ये महसूस किया,” या अधिक व्यावहारिक रूप से, “इसे कहाँ से ले सकता हूँ?!” ये भावनात्मक जुड़ाव, साथ में एक बोलने वाले सर्किट बोर्ड की कच्ची, लगभग पंक-रॉक जैसी स्टाइल, ने जिज्ञासा और माँग का एक सही तूफान खड़ा कर दिया।
अनजाना मास्टरमाइंड और खुली सोच
शियाओ झी एआई के पीछे कोई सिलिकन वैली की दिग्गज कंपनी या शेन्ज़ेन की इलेक्ट्रॉनिक्स की बड़ी फर्म नहीं है, कम से कम सीधे तौर पर तो नहीं। ये प्रोजेक्ट हुआंग गुआन (黄冠) की निजी रुचि से शुरू हुआ, जो शिफांग रोंगहाई (十方融海) नामक कंपनी के संस्थापक और अध्यक्ष हैं। हुआंग, जिन्हें ऑनलाइन “श्रिम्प ब्रदर” (虾哥 – Xiā Gē, शाब्दिक रूप से “झींगा भाई”) के नाम से जाना जाता है, दक्षिण चीन प्रौद्योगिकी विश्वविद्यालय से कंप्यूटर साइंस के स्नातक हैं। उनकी कंपनी, शिफांग रोंगहाई, मुख्य रूप से ऑनलाइन शिक्षा के क्षेत्र में काम करती है, जो मध्यम आयु और बुजुर्गों के लिए व्यावसायिक कौशल और रुचि-आधारित शिक्षा पर ध्यान देती है, जिसमें “पियर ब्लॉसम एजुकेशन” जैसे ब्रांड वॉयस ट्रेनिंग के लिए हैं। शिफांग रोंगहाई के एक लेख के अनुसार, हुआंग अपनी कंपनी के शुरुआती दिनों से ही शिक्षा में एआई की खोज कर रहे थे।
तो, एक शिक्षा टेक वाले व्यक्ति ने एआई हार्डवेयर बनाना क्यों शुरू किया? दरअसल, हुआंग ने अपनी कंपनी के शिक्षा के लिए एआई में अनुभव का लाभ उठाया (उन्होंने ओपनबडी जैसे ओपन-सोर्स बेस पर “इमोशनल मॉडल” जैसे बड़े भाषा मॉडल अनुकूलन विकसित किए थे, जो वॉयस और भावना पहचान जैसी चीजों पर ध्यान देते हैं), और कुछ नया करने की कोशिश की। उन्होंने खुद को हार्डवेयर नवागंतुक बताया, जो सीखते-सीखते आगे बढ़े, और एक साधारण बोर्ड बनाया जो बातचीत के उद्देश्य से उनके एआई मॉडल को चला सके।
यहाँ बात रोचक हो जाती है। अपनी रचना को छुपाने के बजाय, हुआंग ने कुछ महत्वपूर्ण किया: सितंबर 2024 में, उन्होंने शियाओ झी एआई प्रोजेक्ट के कोर को गिटहब पर ओपन-सोर्स कर दिया। उनका घोषित लक्ष्य कोई उत्पाद लॉन्च करना नहीं था, बल्कि ये देखना था कि दूसरे इसके साथ क्या बना सकते हैं। उन्होंने शियाओ झी एआई को “दिमाग” माना और चाहा कि समुदाय “हाथ और पैर” बनाए – यानी विविध हार्डवेयर कार्यान्वयन। उन्होंने एक सहयोगी इकोसिस्टम की कल्पना की, जहाँ डेवलपर्स, शौकीन लोग, और यहाँ तक कि नौसिखिए भी प्रयोग और नवाचार कर सकें।
ये खुली सोच मौलिक थी। टीम ने जानबूझकर ESP32-S3 माइक्रोकंट्रोलर (खास तौर पर ESP32-S3-WROOM-1-N16R8 मॉड्यूल, जैसा कि कुछ गहन विश्लेषणों में उल्लेख किया गया है) को प्राथमिक समर्थित चिप के रूप में चुना। क्यों? जरूरी नहीं कि ये सबसे शक्तिशाली विकल्प था, बल्कि जैसा कि टीम ने स्वीकार किया, Espressif Systems (शंघाई स्थित कंपनी) के ESP32 चिप्स का एक विशाल, अच्छी तरह से दस्तावेजीकरण किया हुआ इकोसिस्टम है, ढेर सारे ऑनलाइन ट्यूटोरियल हैं, और ये बेहद शुरुआती-अनुकूल और सस्ते हैं। इससे प्रवेश की बाधा काफी कम हो गई। आपको इंजीनियरिंग डिग्री की जरूरत नहीं थी; प्रेरित शौकीन लोग, छात्र, यहाँ तक कि अपने बच्चों के साथ प्रोजेक्ट्स पर काम करने वाले माता-पिता भी इसमें शामिल हो सकते थे।
ये दृष्टिकोण कुछ बड़ी कॉरपोरेशनों के “ओपन” प्लेटफॉर्म्स से अलग है, जो कभी-कभी गेटकीपर्स के साथ क्यूरेटेड गार्डन जैसे लगते हैं, अक्सर आवेदन और अनुमोदन की माँग करते हैं, और स्थापित कंपनियों को लक्षित करते हैं न कि व्यक्तिगत प्रयोगकर्ताओं को। शियाओ झी एआई वास्तव में खुला लगता था।
अंदर की बात: एआई हार्डवेयर को सुलभ बनाना
आइए, शियाओ झी एआई को चलाने वाली चीजों पर एक नजर डालते हैं, बिना बहुत तकनीकी विवरण में उलझे। इसकी सुंदरता इसकी मॉड्यूलरिटी और सुलभता में निहित है।
कीमत: लोगों के लिए एआई
शायद सबसे क्रांतिकारी पहलू? लागत। चीन के विशाल इलेक्ट्रॉनिक्स बाजारों (शेन्ज़ेन के हुआकियांगबेई की सोचें, लेकिन ताओबाओ जैसे प्लेटफॉर्म्स के माध्यम से ऑनलाइन सुलभ) से घटकों को खरीदकर एक बेसिक शियाओ झी एआई डिवाइस खुद बनाने में सिर्फ 50 RMB (लगभग $7 USD) खर्च हो सकता है।
यहाँ तक कि ताओबाओ, पिंदुओदुओ, या “शियान्यू” (闲鱼, जिसे अक्सर “सीफूड मार्केट” – 海鲜市场 कहा जाता है, चीन का लोकप्रिय सेकंड-हैंड मार्केटप्लेस) जैसे ई-कॉमर्स प्लेटफॉर्म्स पर शौकीनों या छोटे विक्रेताओं द्वारा बेचे जाने वाले तैयार यूनिट्स की कीमत आम तौर पर 80 RMB से 139 RMB (लगभग $11 से $19 USD) तक होती है।
इसे गहराई से समझिए। दो मूवी टिकटों की कीमत में एक कस्टमाइज करने योग्य, बातचीत करने वाला एआई हार्डवेयर डिवाइस। ये अविश्वसनीय किफायतीपन इसकी स्वीकार्यता का एक बड़ा कारण है। ये एआई हार्डवेयर को महंगे गैजेट्स के दायरे से निकालकर एक सुलभ टूल या खिलौने में बदल देता है।
एक इकोसिस्टम का विस्फोट: जमीनी नवाचार की ताकत
ओपन-सोर्स रिलीज़ और वायरल वीडियो ने चिंगारी पर तेल डालने का काम किया। गिटहब रिपॉजिटरी (github.com/78/xiaozhi-esp32) ने जल्दी ही चर्चा बटोरी, खबरों के मुताबिक गिटहब ग्लोबल ट्रेंडिंग चार्ट्स में जगह बनाई और हजारों स्टार्स और फोर्क्स हासिल किए। एक जीवंत समुदाय उभरकर सामने आया।
अचानक, शियाओ झी एआई सिर्फ एक चीज नहीं रहा; ये हजारों चीजें बन गया:
ये किसी केंद्रीय कंपनी द्वारा नियोजित नहीं था; ये यूजर्स की सामूहिक रचनात्मकता से प्रेरित था – “पिंगमिन चुआंगशिन” (平民创新), या “जमीनी नवाचार,” जैसा कि शिफांग रोंगहाई ने खुद इसे परिभाषित किया। शिफांग रोंगहाई की आधिकारिक टीम छोटी रही (खबरों के मुताबिक लोकप्रियता में विस्फोट के बाद भी 10 लोगों से कम) और कोर प्लेटफॉर्म और सॉफ्टवेयर के रखरखाव पर केंद्रित रही, जबकि हार्डवेयर विविधीकरण को समुदाय के हवाले छोड़ दिया।
गीकपार्क की रिपोर्ट के अनुसार, 1,00,000 सक्रिय डिवाइसेज में से केवल लगभग एक हजार “आधिकारिक” वॉयस बॉक्स थे जो शुरू में बेचे गए; अधिकांश DIY या थर्ड-पार्टी द्वारा असेंबल किए गए यूनिट्स थे। मासिक वृद्धि दर 300% तक पहुँच रही थी – हर महीने दोगु
ठीक है, आराम से बैठें, एक कप कॉफी लें (या अगर आप मेरी तरह स्थानीय…
ठीक है, एक कप कॉफी लें (या शायद नारियल पानी?) और आराम से बैठें, क्योंकि…
मैं एक अमेरिकी नागरिक हूँ, जो आधुनिक चीन की जटिलताओं और गहराइयों में जी रहा…
ठीक है, चलिए हम चीन के सबसे प्रतिष्ठित ब्रांडों में से एक के इर्द-गिर्द उलझी…
ठीक है, एक कप कॉफी लें और चलिए एक ऐसे विशाल विषय में गोता लगाते…
वैश्विक आर्थिक रुझानों पर नजर रखने वालों के लिए, महामारी के बाद चीन का पुनरुत्थान…