सामग्री पर जाएँ
cutty.dev
All posts

25 भाषाओं में लाइव — एक मील का पत्थर

cutty.dev अब बीस पाँच भाषाओं में बात करता है। यह क्या मतलब रखता है, क्यों इन विशेष भाषाओं का चयन किया गया, और बाहर डेटा भेजे बिना इसे कैसे किया गया, इसकी एक छोटी कहानी।

cutty.dev के अस्तित्व के पहले कुछ सप्ताहों में यह दो भाषाओं — पोलिश और अंग्रेजी — में बात करता था। आज यह पच्चीस भाषाओं में बात करता है। यह उसका एक छोटा सा किस्सा है कि इसका क्या मतलब है और यह क्यों जरूरी था।

एक सूची जो कुछ मायने रखती है

पोलिश। अंग्रेज़ी। जर्मन। फ्रेंच। स्पैनिश। इतालवी। चेक। रोमानियाई। हंगेरियन। ग्रीक। डच। स्वीडिश। फिनिश। यूक्रेनियन। तुर्की। अरबी (दाएं से बाएं)। हिब्रू (दाएं से बाएं)। चीनी। जापानीकोरियाई। हिंदी। थाई। वियतनामी। इंडोनेशियाई। पुर्तगाली।

चयन यादृच्छिक नहीं है। वे भाषाएँ हैं जो यूरोपीय बाजारों के सबसे बड़े हिस्से को पकड़ती हैं, साथ ही यूरोप के बाहर की प्रमुख बाजारों को — मध्य पूर्व और उत्तरी अफ्रीका (अरबी), इज़राइल (हिब्रू), पूर्वी एशिया (चीनी, जापानी, कोरियाई), उपमहाद्वीपीय भारत (हिंदी) और दक्षिण-पूर्व एशिया (थाई, वियतनामी, इंडोनेशियाई)। मिलकर — अरबों लोग, अपनी अपनी भाषा में, पहले दौरे से ही।

स्पेनिश स्पेन और लैटिन अमेरिका को खोलता है। पुर्तगाली — पुर्तगाल, ब्राजील, अफ्रीकी देशों को। फ्रेंच — फ्रांस, बेल्जियम, क्यूबेक, अफ्रीका के बड़े हिस्से को। इनमें से प्रत्येक भाषा एक बाजार है, जिसका आकलन लाखों संभावित दर्शकों के आधार पर किया जाता है।

"नेटिव" का क्या अर्थ है

अनुवाद बाहरी API के माध्यम से नहीं किए गए हैं। ये स्थानीय AI मॉडल द्वारा किए गए हैं, जो हमारी अपनी इंफ्रास्ट्रक्चर पर चलाया गया है। इसका मतलब है:

  • हमारे इंटरफ़ेस से कोई भी पात्र हमारे नेटवर्क से कभी बाहर नहीं गया — किसी भी बाहरी AI प्रदाता ने हमारे पात्रों में से एक भी नहीं पाया।
  • गुणवत्ता केवल यांत्रिक अनुवाद से कहीं अधिक है — मॉडल संदर्भ, टोन और सूक्ष्मताओं को बनाए रखता है।
  • प्रति क्वेरी कोई लागत नहीं — हम चाहे तो अनुवादों को नवीनीकृत कर सकते हैं, बिल में कोई अतिरिक्त शुल्क नहीं।

पहली पुनरावृत्ति के बाद, प्रत्येक पृष्ठ को दृश्य रूप से जाँचा गया — क्या लेआउट बिगड़ रहा है, क्या लंबा जर्मन पाठ फ्रेम से बाहर निकल रहा है, और क्या अरबी और हिब्रू दाईं से बाईं ओर सही ढंग से प्रदर्शित हो रहे हैं।

RTL — एक सीमांत मामला

अरबी और इब्रानी को अलग से काम करने की आवश्यकता थी। पूरी साइट क्षैतिज रूप से प्रतिबिंबित है — नेविगेशन दाईं से बाईं ओर जाती है, तीर उल्टे हैं, हीरो ग्रेडिएंट दूसरी ओर है। प्रभाव — अरबी और इब्रानी संस्करण प्राकृतिक दिखते हैं, न कि आंशिक रूप से दाईं से बाईं ओर लिपि का समर्थन करने वाली एक आंशिक रूप से संशोधित पश्चिमी साइट।

CJK और अन्य लिपियाँ

चीनी, जापानी और कोरियाई CJK चिह्नों का उपयोग करते हैं, जिनमें से अधिकांश वेब फ़ॉन्ट्स में नहीं होते हैं। हमने संबंधित फ़ॉलबैक जोड़े हैं, जो केवल उन संस्करणों पर लोड होते हैं — बाकी स्थानीयकरण हमारे मानक, हल्के फ़ॉन्ट का उपयोग करते हैं। थाई, हिंदी और अन्य लिपियों को भी इसी तरह से व्यवहार मिला: प्रत्येक भाषा अपने लिपि प्रणाली में वैसे ही दिखती है, जैसी वह दिखनी चाहिए।

यह सब क्यों समझ में आता है

अधिकांश कंपनियाँ अपने उत्पाद को अंग्रेजी में लॉन्च करती हैं और "शायद किसी दिन जब ट्रैफिक आए तो अन्य भाषाएँ जोड़ देंगी।" cutty.dev ने इसके विपरीत रास्ता चुना — शुरुआत से ही 25 भाषाएँ, ताकि जब स्पेन, चेक गणराज्य, मिस्र, ताइवान या वियतनाम से कोई व्यक्ति सर्च इंजन के जरिए हमारी वेबसाइट पर आए, तो वह तुरंत अपनी भाषा देख सके।

यह भी सम्मान का मामला है। इंटरनेट डिफ़ॉल्ट रूप से अंग्रेज़ी को मानता है। यूरोप से आया एक छोटा सा उपकरण जो आपको कोरियाई या थाई भाषा में स्वागत करता है, यह इस बात की ओर इशारा करता है कि यह किसके लिए बनाया गया है: सभी के लिए, न कि केवल अंग्रेज़ी बोलने वाले केंद्र के लिए।

आगे क्या

सूची लंबी है, लेकिन यह पूर्ण नहीं है। यदि आपकी भाषा अभी तक यहाँ नहीं है — लिखें। एक नई भाषा जोड़ने में महीनों नहीं, बस कुछ दिन लगते हैं।

और अगर हम तुम्हारी भाषा में बात कर रहे हैं — बस पहले लिंक को छोटा करो। यह तुम्हारे पास तुम्हारे जैसे ही दिखना चाहिए।