Universal Character Encoding

Today I made a brief presentation introducing what is Unicode and how Tamil is encoded in UNICODE (தமிழில் ஒருங்குறி).

Salient points from the presentation:

  • Computers at their most basic level just deal with numbers. They store letters, numerals and other characters by assigning a number for each one.
  • In the pre-Unicode environment, we had single 8-bit characters sets, which limited us to 256 characters max. No single encoding could contain enough characters to cover all the languages.
  • All 22 Languages including Tamil has represented and included in UNICODE by TDIL, Govt. of India
  • Unicode provides a unique number for every character, for any: Platform, Program, Language. Supported by other standards bodies including ISO, W3C, IETF, ELRA and BIS
  • தமிழ் எழுத்துக்களான ஒருங்குறி எண்கள்: ஒருங்குறி எண் 2944 முதல் எண் 3071 வரை
  • ஒருங்குறியினால் உண்டாகும் பயன்கள்: தரவுகள் பரிமாற்றம், தேடுதல் பொறி, மின் – அஞ்சல், இணையம்,  மற்ற மொழி தேடுதல் மற்றும் செல்பேசிகள்

You can download the presentation from here.

A few slides are given below:

What is UNICODE?

  • Provides a unique number for every character, for any

–Platform

–Program

–Language

  • The globalization solution for scripts and languages
  • Simple and consistent manner
  • Supported by other standards bodies including ISO, W3C, IETF, ELRA and BIS
  • Compatible with ISO 10646
  • Unicode is an encoding independent of font variations

ஒருங்குறி

  • மொத்த எண்கள்:  65,536. 107,000 எழுத்துக்கள்(covering 90 scripts)
  • தமிழ்: எண் 2944 முதல் எண் 3071
  • 16 பிட்(16 BIT)
  • மைக்ரோசாப்ட் நிறுவனம் – ‘லதா’, லினக்ஸ், அப்பிள்
  • ஏராளமான எழுத்துருக்கள் – இலவச, தனியார் பயன்பாட்டுச் செயலிகள் ஏராளம்

ஒருங்குறியினால் உண்டாகும் பயன்கள்

  • தரவுகள் பரிமாற்றம்
  • தேடுதல் பொறி, மின் – அஞ்சல், இணையம்
  • மற்ற மொழி தேடுதல்
  • தரப்படுத்துதல்
  • சார்புச்சேவை (Support Service)
  • பலப்பல பயன்நிரல்கள் (User Programs)
  • செல்பேசிகள்

கல்விக்கூடங்களில் பயன்பாடு

  • பல்லாயிரக்கணக்கான கணினிகளை உடனடி தகவல் பரிமாற்றத்திற்கு தயார் செய்ய இயலும்.
  • ஆயிரக்கணக்கான பள்ளி மற்றும் கல்லூரிகள், மற்றும் அனைத்துப் பல்கலைக்கழகங்கள் ஆகியவற்றில் உள்ள கணினிகளை தமிழ் உபயோகத்திற்கு ஏற்றதாகச் செய்ய இயலும்.

மக்களுக்கு பயன்பாடு

  • இணைய தளங்களிலும், மின் அஞ்சல், கணினியிலும் தமிழிலேயே தமிழ் மொழியில் உருவான ஆவணங்கள் (Documents), தரவுகள் (Data) ஆகியவற்றைத் தேட, உருவாக்க மற்றும் பரிமாறிக்கொள்ள இயலும்.
  • ஆராய்ச்சி, ஆய்வுக் கட்டுரைகள், பாடங்கள் மற்றும் அனைத்து ஆவணங்களை ஒன்றினைக்கும் வழிமுறைகள் ஆகியவற்றை வரையறுப்பதன் வழிவகைகளை உருவாக்க இயலும்.

அரசுக்கு பயன்பாடு

  • ஒருங்குறி முறையில் உருவாக்கப்பட்ட ஆவணங்களை எந்தவித பிற மென்பொருட்கள், தனி எழுத்துருக்கள் (Fonts) இன்றி படிக்க இயலும்.
  • எதிர்கால சந்ததியினருக்கு தமிழின் அனைத்து ஆவணங்களும் பாதுகாப்பாகச் சென்றடையும் வழிவகையை ஏற்படுத்தல்.

Discover more from Mangoidiots

Subscribe to get the latest posts sent to your email.

Discover more from Mangoidiots

Subscribe now to keep reading and get access to the full archive.

Continue reading

Discover more from Mangoidiots

Subscribe now to keep reading and get access to the full archive.

Continue reading