मैं पाइथन में सभी जापानी हिरणाना को कटकाना पात्रों में कैसे परिवर्तित कर सकता हूं? - अजगर, यूनिकोड, सामान्यीकरण, यूनिकोड-सामान्यीकरण

हीरागाना और कटकाना चार्ट से, यह दिखता हैजापानी पाठ को हीरागाना या कटकाना में "सामान्य" करना संभव होना चाहिए। यह एक तालिका बनाने और खोज / बदलने के लिए एक शब्दकोश / regex तालिका को लागू करने के लिए बहुत सीधा है। क्या किसी को पता है कि काम पहले से ही कहाँ किया गया है?

उत्तर:

जवाब के लिए 2 № 1

हालांकि आप ऐसा क्यों करना चाहेंगे?कटकाना पारंपरिक रूप से अन्य भाषाओं से उधार लिए गए शब्दों के लिए उपयोग किया जाता है, जबकि हीरागाना का उपयोग जापानी मूल भाषा के लिए किया जाता है। एक या दूसरे रूप में जापानी पाठ को सामान्य करने से आप वास्तव में इसके पढ़ने में बाधा बन सकते हैं (कम से कम मेरे लिए यह कठिन होगा क्योंकि मैं इसे सामान्यीकृत करके संदर्भ खो रहा हूं)।

लेकिन आपके सवाल के जवाब में, ऐसा लगता है कि आपका क्या कहना है: JCONV


उत्तर № 2 के लिए 1

आप ऐसा कर सकते हैं जो आप बहुत जल्दी करना चाहते हैं।

हालाँकि यह स्पष्ट रूप से स्पष्ट नहीं है कि आप ऐसा क्यों करना चाहेंगे।

जिसे मैं किसी भाषा में सामान्य कहूंगाएक लैटिन-आधारित वर्णमाला में लिखा गया है जिसमें लोअरकेसिंग, व्हाट्सएप को सामान्य करना, और अलग-अलग उच्चारण आदि शामिल हैं ताकि परिणाम ASCII हो। ऐसा करने का उद्देश्य प्रदर्शन के लिए नहीं होगा, बल्कि उपयोगकर्ता द्वारा दर्ज किए गए पाठ की तुलना किसी प्रकार की फ़ज़ी सर्च / मैच / लुकअप परिदृश्य में करने के लिए होगी। यह कहा जा रहा है कि उच्चारण की गलतियाँ आदि भाषाओं के मूल लेखकों के साथ भी काफी सामान्य हैं।

उस भूमिका को देखते हुए जिसमें हीरागाना की भूमिका हैजापानी लेखन प्रणाली (शब्दों में अक्सर एक कांजी स्टेम और हिरागाना प्रत्यय होता है) मैं "हिरगाना पात्रों को कटकाना में बदलने के लिए किसी भी उपयोग की कल्पना नहीं कर सकता ... कृपया मुझे बताएं।


संबंधित सवाल
सबसे लोकप्रिय