Rostrum தமிழ்

Brief Introduction to Unicode in Tamil

Universal Character Encoding

Today I made a brief presentation introducing what is Unicode and how Tamil is encoded in UNICODE (தமிழில் ஒருங்குறி).

Salient points from the presentation:

  • Computers at their most basic level just deal with numbers. They store letters, numerals and other characters by assigning a number for each one.
  • In the pre-Unicode environment, we had single 8-bit characters sets, which limited us to 256 characters max. No single encoding could contain enough characters to cover all the languages.
  • All 22 Languages including Tamil has represented and included in UNICODE by TDIL, Govt. of India
  • Unicode provides a unique number for every character, for any: Platform, Program, Language. Supported by other standards bodies including ISO, W3C, IETF, ELRA and BIS
  • தமிழ் எழுத்துக்களான ஒருங்குறி எண்கள்: ஒருங்குறி எண் 2944 முதல் எண் 3071 வரை
  • ஒருங்குறியினால் உண்டாகும் பயன்கள்: தரவுகள் பரிமாற்றம், தேடுதல் பொறி, மின் – அஞ்சல், இணையம்,  மற்ற மொழி தேடுதல் மற்றும் செல்பேசிகள்

You can download the presentation from here.

A few slides are given below:

What is UNICODE?

  • Provides a unique number for every character, for any

–Platform

–Program

–Language

  • The globalization solution for scripts and languages
  • Simple and consistent manner
  • Supported by other standards bodies including ISO, W3C, IETF, ELRA and BIS
  • Compatible with ISO 10646
  • Unicode is an encoding independent of font variations

ஒருங்குறி

  • மொத்த எண்கள்:  65,536. 107,000 எழுத்துக்கள்(covering 90 scripts)
  • தமிழ்: எண் 2944 முதல் எண் 3071
  • 16 பிட்(16 BIT)
  • மைக்ரோசாப்ட் நிறுவனம் – ‘லதா’, லினக்ஸ், அப்பிள்
  • ஏராளமான எழுத்துருக்கள் – இலவச, தனியார் பயன்பாட்டுச் செயலிகள் ஏராளம்

ஒருங்குறியினால் உண்டாகும் பயன்கள்

  • தரவுகள் பரிமாற்றம்
  • தேடுதல் பொறி, மின் – அஞ்சல், இணையம்
  • மற்ற மொழி தேடுதல்
  • தரப்படுத்துதல்
  • சார்புச்சேவை (Support Service)
  • பலப்பல பயன்நிரல்கள் (User Programs)
  • செல்பேசிகள்

கல்விக்கூடங்களில் பயன்பாடு

  • பல்லாயிரக்கணக்கான கணினிகளை உடனடி தகவல் பரிமாற்றத்திற்கு தயார் செய்ய இயலும்.
  • ஆயிரக்கணக்கான பள்ளி மற்றும் கல்லூரிகள், மற்றும் அனைத்துப் பல்கலைக்கழகங்கள் ஆகியவற்றில் உள்ள கணினிகளை தமிழ் உபயோகத்திற்கு ஏற்றதாகச் செய்ய இயலும்.

மக்களுக்கு பயன்பாடு

  • இணைய தளங்களிலும், மின் அஞ்சல், கணினியிலும் தமிழிலேயே தமிழ் மொழியில் உருவான ஆவணங்கள் (Documents), தரவுகள் (Data) ஆகியவற்றைத் தேட, உருவாக்க மற்றும் பரிமாறிக்கொள்ள இயலும்.
  • ஆராய்ச்சி, ஆய்வுக் கட்டுரைகள், பாடங்கள் மற்றும் அனைத்து ஆவணங்களை ஒன்றினைக்கும் வழிமுறைகள் ஆகியவற்றை வரையறுப்பதன் வழிவகைகளை உருவாக்க இயலும்.

அரசுக்கு பயன்பாடு

  • ஒருங்குறி முறையில் உருவாக்கப்பட்ட ஆவணங்களை எந்தவித பிற மென்பொருட்கள், தனி எழுத்துருக்கள் (Fonts) இன்றி படிக்க இயலும்.
  • எதிர்கால சந்ததியினருக்கு தமிழின் அனைத்து ஆவணங்களும் பாதுகாப்பாகச் சென்றடையும் வழிவகையை ஏற்படுத்தல்.