புத்தகப் பக்கங்களில் இருக்கும் தமிழ் எழுத்துக்களைக் கண்டுக் கொள்வது (Tamil OCR) கடந்த இருபத்தைந்து ஆண்டுகளில் கனவாகவே பல தமிழ் இணைய மாநாடுகளில் பேசப்பட்டு வந்தது. கடந்த சில ஆண்டுகளில் நல்வாய்ப்பாக இயந்திரக் கற்றல் பல பல மடங்கு வளர்ந்ததால் இந்தக் கனவு இன்று பெருமளவு சாத்தியமாகி விட்டது.
இன்றைக்கு வீட்டில் இருந்த ஒரு மளிகைக்கடை ரசீதை ஐ.போனில், கூகுள் போட்டோ செயலியில் இருக்கும் கூகுள் லென்ஸ் வசதியைப் பயன்படுத்தி வருடிப் பார்த்தேன். எழுதிய மளிகைக் கடை அண்ணாச்சிக்குக் கூடக் கையெழுத்து புரியுமா என்று தெரியாத ரசீதிலிருந்து, ஆச்சரியமாக கூகுள் லென்ஸ் (பல) வார்த்தைகளைச் சரியாக கண்டறிந்து கொடுத்துள்ளது. இணைப்பில் இருக்கும் படங்களைக் காணவும்.

On the left is the receipt in Tamil opened in Google Lens, and on the right is the recognized text
In the past, I have written about using Python and Google Cloud Vision to recognize Tamil text in your own applications and getting Tamil text from printed books using the open-source Tesseract app.
#tamilocr #GoogleLens #GooglePhotos #tamiltext
Comments