இந்தக் காப்பி அடிக்கிற புத்தி நம்மைவிட்டுப் போகாது போலிருக்கிறது.

ட்விட்டரைப் பார்த்து கோ, வாட்ஸ்அப்பைப் பார்த்து ஹைக், யெல்ப்பை பார்த்து கின். இந்த வரிசையில் உலகின் தலைசிறந்த கட்டற்ற கலைக்களஞ்சியமான விக்கிப்பீடியாவைப் பார்த்து தமிழில் தமிழ் விக்கி (tamil dot wiki) வந்தது, அதே போல இந்திய அளவில் (பல இந்திய மொழிகளில்) பாரத்பீடியா (bharatpedia dot org) என்று சில ஆண்டுகளாக இருக்கிறதாம். இன்று ஓலா (Ola) பற்றி இணையத்தில் தேடப் போக மைக்ரோசாப்ட் பிங்கும், டக்டக்கோவும் முதல் பத்து வரிகளில் விக்கிப்பீடியா முகவரிகளைக் காட்டாமல் பாரத்பீடியாவைக் காட்டினார்கள். என்னவென்று போய் பார்த்தால் விக்கிப்பீடியாவின் திற மூல மென்பொருளைப் பயன்படுத்தி இருக்கிறார்கள். அது பரவாயில்லை, ஆனால் தரவுகள் விக்கிப்பீடியாவில் இருந்தே நகல் எடுத்த மாதிரி இருக்கிறது. முகப்புப் பக்கத்தில் விளம்பரங்களும் வருகிறது. அதில் இருக்கும் தேடுபொறியும் சுமாராகவே வேலை செய்கிறது.

[குறிப்பு: விக்கிப்பீடியா செய்வது எல்லாம் சரியென்று நான் சொல்லவில்லை. நான் எழுதிய சில திருத்தங்களும் ஏற்கப்படவில்லை. நிராகரிப்புக்கான காரணங்கள் எனக்கு ஏற்புடையதாக இல்லை. ஆனால் அவர்களின் ஒட்டு மொத்தத் தரத்தில், வழிமுறைகளில், செயற்பாங்கில் குறை சொல்ல முடியாது. நாம் தனியாக இந்தியாவில் ஒன்று உருவாக்குகிறோம் என்றால் அது விக்கிப்பீடியாவைக் காட்டிலும் ஏதாவது ஒரு வகையிலாவது முந்தியிருக்க வேண்டும். எங்களுக்கு அவர்களைப் பிடிக்கவில்லை (அதிலும் தவறில்லை) என்பது மட்டும் போராது. இன்றுவரை உலகளவில் விக்கிப்பீடியாவை முந்த முடியவில்லை என்பது யதார்த்தம். சமீபத்தில் ஒரு குறிப்பிட்ட சிறிய துறையில் மட்டும் சிங்கப்பூர் முயன்றுவருகிறார்கள், ஆனால் இன்னும் சொல்லும்படி அது வளரவில்லை.]

இத்தகைய அரை வேக்காட்டு முயற்சிகள் எதற்கு என்றே புரியவில்லை. இதைச் சொன்னால் சீனாவும் காப்பியடித்தது என்று சொல்வார்கள். அது முப்பது ஆண்டுகளுக்கு முன்னர் நடந்த பழைய கதை. அதிலிருந்து இன்று அவர்களின் தொழில்நுட்பத் திறன் எங்கோ போய்விட்டது, நாம் நகல் எடுத்து ஸ்டிக்கர் (Sticker) ஒட்டுவதோடு நின்று விடுகிறோம். இன்று வாட்ஸ்அப்பை (WhatsApp) விட வீ-சாட் (We Chat) பல மடங்கு சக்தி, வசதிகள் வாய்ந்திருக்கிறது. பேஸ்புக் மேட்டாவிற்கே (Facebook Meta) பல விசயங்களில் சீனா செயலிகள் வழிகாட்டுகிறது என்றும் சொல்கிறார்கள். ஆனால் நாம் காப்பியடித்து ஏதோ நாமே தயாரித்ததைப் போல பிலிம், பந்தாவிடுகிறோம். நுட்பங்களைக் காப்பியடிப்பது தவறில்லை அதோடு மகிழ்ந்துவிடுகிறோம். அதிலிருந்து கற்றுக் கொண்டு புதுமைகளை நமக்காக மாற்றி மேம்படுத்துகிறோமா என்றால் நிச்சயம் இல்லை என்றே வருத்தத்தோடு சொல்ல வேண்டும்.

இந்த நோய் இதோடு நின்றால் பரவாயில்லை. இது இப்போது செயற்கை நுண்ணறிவு (ஏ.ஐ) விசயத்திலும் வந்துவிட்டது. இன்று வரை இந்தியாவிலிருந்து சுயமாக உருவாக்கப்பட்ட ஓர் அடிப்படை பெரிய மொழி (இயற்றறிவு) மாதிரி கூட வரவில்லை. சீனாவிலிருந்து மாதத்திற்கு ஒன்று வருகிறது. இதற்குச் செலவு செய்யப் பல அமெரிக்க பில்லியன் டாலர்கள் தேவை. சரி, ஆனால் இந்தியா இன்று ஏழை நாடு இல்லை. தமிழ்நாட்டின் பொருளாதாரமே சில ஐரோப்பா நாடுகளை விட அதிகம்.

இன்று ஏ.ஐ.யில் இந்த அளவு வர, சீனா சில தசாப்தங்களுக்கு முன்பே தங்களின் பல்கலைக்கழகங்களில் ஆராய்ச்சிக்கான முதலீடுகளைத் தொடங்கிவிட்டார்கள் – இதைப் புரிந்து கொள்ளச் சில மாதங்களுக்கு முன்னர் நான் டீப்-சீக் உருவான கதையைப் பற்றி மெட்ராஸ் பேப்பரில் நான் எழுதிய கட்டுரையைப் படிக்கலாம் (முதல் கருத்தில் முகவரி இருக்கிறது). ஆனால், நாம் இன்னும் பெரிய அளவில் இதைத் தொடங்கவே இல்லை. இன்னும் அமெரிக்கத் திறமூலத் தயாரிப்புகளின் மேல் ஸ்டிக்கர் (Sticker) ஒட்டியே மகிழ்ந்து, நமக்கு நாமே கைதட்டிக் கொள்கிறோம்.

இவை எதுவுமே தாராள மயமாக்கலை, திறந்த உலக வர்த்தகத்தை, முதலாளித்துவத்தை எதிர்த்து இல்லை – அவை அனைத்தும் வேண்டும். அவற்றோடு நமக்கான சிலிக்கன் சில்லுகளும், சுயமாக உருவாக்கப்பட்ட சமூக வலைத்தளங்களும், கலைக்களஞ்சியமும், ஏ.ஐ. மாதிரிகளும் வேண்டும். இந்தியா மனது வைத்தால் முடியும் இன்று சுரும்பூர்தி (Drone), ஏவுகணை, இரயில் தொழில்நுட்பங்களில் நாம் உலகளவில் இருக்கிறோம். ஆனால் உண்மையாகவே மனது வைக்க வேண்டும்.

இதை மாற்ற, முதலில் நாம் நமது மொத்த மன மருட்சியில் இருந்து வெளிவர வேண்டும்.


Discover more from Mangoidiots

Subscribe to get the latest posts sent to your email.

2 thought on “விக்கிப்பீடியாவை நகலெடுத்து ஸ்டிக்கர் ஒட்டுவதை நிறுத்துவோம்”
  1. தாங்கள் செல்வது சரிதான் ஆனால் பாதியில் முன்னேற்றம் இல்லாத freesoftware களை சிலதனி மனிதர்கள் முடிந்த அளவு அவர்களின் பங்களிப்பை தருகீரார்கள் இது எல்லோருக்கும் இந்த செய்தி சேரவில்லை என்பது நிதர்சனம் இந்தியா இதில் எத்தனை கவனம் செலுத்தி உள்ளது என்பது கேள்விக்குறி பார்க்க இங்கு https://jskhaleel.wordpress.com/2025/08/20/improving-tamil-ocr-accuracy-with-tesseract-5-dataset-creation-training-and-future-plans/

    1. ஆம். தங்கமான மனதுக்காரர்கள் இவர்கள். இந்த மாதிரி தன்னார்வலர்களின் பங்களிப்பால் தானே இன்றும் இணையம் இயங்குகிறது. கோடி நன்றிகள் அவர்களுக்கு. தகவலுக்கு நன்றி.

Leave a Reply

Discover more from Mangoidiots

Subscribe now to keep reading and get access to the full archive.

Continue reading

Discover more from Mangoidiots

Subscribe now to keep reading and get access to the full archive.

Continue reading