
Brief Introduction to Unicode in Tamil
Today I made a brief presentation introducing what is Unicode and how Tamil is encoded in UNICODE (தமிழில் ஒருங்குறி).
Salient points from the presentation:
- Computers at their most basic level just deal with numbers. They store letters, numerals and other characters by assigning a number for each one.
- In the pre-Unicode environment, we had single 8-bit characters sets, which limited us to 256 characters max. No single encoding could contain enough characters to cover all the languages.
- All 22 Languages including Tamil has represented and included in UNICODE by TDIL, Govt. of India
- Unicode provides a unique number for every character, for any: Platform, Program, Language. Supported by other standards bodies including ISO, W3C, IETF, ELRA and BIS
- தமிழ் எழுத்துக்களான ஒருங்குறி எண்கள்: ஒருங்குறி எண் 2944 முதல் எண் 3071 வரை
- ஒருங்குறியினால் உண்டாகும் பயன்கள்: தரவுகள் பரிமாற்றம், தேடுதல் பொறி, மின் – அஞ்சல், இணையம், மற்ற மொழி தேடுதல் மற்றும் செல்பேசிகள்
You can download the presentation from here.
A few slides are given below:
What is UNICODE?
- Provides a unique number for every character, for any
–Platform
–Program
–Language
- The globalization solution for scripts and languages
- Simple and consistent manner
- Supported by other standards bodies including ISO, W3C, IETF, ELRA and BIS
- Compatible with ISO 10646
- Unicode is an encoding independent of font variations
ஒருங்குறி
- மொத்த எண்கள்: 65,536. 107,000 எழுத்துக்கள்(covering 90 scripts)
- தமிழ்: எண் 2944 முதல் எண் 3071
- 16 பிட்(16 BIT)
- மைக்ரோசாப்ட் நிறுவனம் – ‘லதா’, லினக்ஸ், அப்பிள்
- ஏராளமான எழுத்துருக்கள் – இலவச, தனியார் பயன்பாட்டுச் செயலிகள் ஏராளம்
ஒருங்குறியினால் உண்டாகும் பயன்கள்
- தரவுகள் பரிமாற்றம்
- தேடுதல் பொறி, மின் – அஞ்சல், இணையம்
- மற்ற மொழி தேடுதல்
- தரப்படுத்துதல்
- சார்புச்சேவை (Support Service)
- பலப்பல பயன்நிரல்கள் (User Programs)
- செல்பேசிகள்
கல்விக்கூடங்களில் பயன்பாடு
- பல்லாயிரக்கணக்கான கணினிகளை உடனடி தகவல் பரிமாற்றத்திற்கு தயார் செய்ய இயலும்.
- ஆயிரக்கணக்கான பள்ளி மற்றும் கல்லூரிகள், மற்றும் அனைத்துப் பல்கலைக்கழகங்கள் ஆகியவற்றில் உள்ள கணினிகளை தமிழ் உபயோகத்திற்கு ஏற்றதாகச் செய்ய இயலும்.
மக்களுக்கு பயன்பாடு
- இணைய தளங்களிலும், மின் அஞ்சல், கணினியிலும் தமிழிலேயே தமிழ் மொழியில் உருவான ஆவணங்கள் (Documents), தரவுகள் (Data) ஆகியவற்றைத் தேட, உருவாக்க மற்றும் பரிமாறிக்கொள்ள இயலும்.
- ஆராய்ச்சி, ஆய்வுக் கட்டுரைகள், பாடங்கள் மற்றும் அனைத்து ஆவணங்களை ஒன்றினைக்கும் வழிமுறைகள் ஆகியவற்றை வரையறுப்பதன் வழிவகைகளை உருவாக்க இயலும்.
அரசுக்கு பயன்பாடு
- ஒருங்குறி முறையில் உருவாக்கப்பட்ட ஆவணங்களை எந்தவித பிற மென்பொருட்கள், தனி எழுத்துருக்கள் (Fonts) இன்றி படிக்க இயலும்.
- எதிர்கால சந்ததியினருக்கு தமிழின் அனைத்து ஆவணங்களும் பாதுகாப்பாகச் சென்றடையும் வழிவகையை ஏற்படுத்தல்.

