புத்தகப் பக்கங்களில் இருக்கும் தமிழ் எழுத்துக்களைக் கண்டுக் கொள்வது (Tamil OCR) கடந்த இருபத்தைந்து ஆண்டுகளில் கனவாகவே பல தமிழ் இணைய மாநாடுகளில் பேசப்பட்டு வந்தது. கடந்த சில ஆண்டுகளில் நல்வாய்ப்பாக இயந்திரக் கற்றல் பல பல மடங்கு வளர்ந்ததால் இந்தக் கனவு இன்று பெருமளவு சாத்தியமாகி விட்டது.

இன்றைக்கு வீட்டில் இருந்த ஒரு மளிகைக்கடை ரசீதை ஐ.போனில், கூகுள் போட்டோ செயலியில் இருக்கும் கூகுள் லென்ஸ் வசதியைப் பயன்படுத்தி வருடிப் பார்த்தேன். எழுதிய மளிகைக் கடை அண்ணாச்சிக்குக் கூடக் கையெழுத்து புரியுமா என்று தெரியாத ரசீதிலிருந்து, ஆச்சரியமாக கூகுள் லென்ஸ் (பல) வார்த்தைகளைச் சரியாக கண்டறிந்து கொடுத்துள்ளது. இணைப்பில் இருக்கும் படங்களைக் காணவும்.

On the left is the receipt in tamil opened in Google Lens, on the right is the recognized text

On the left is the receipt in Tamil opened in Google Lens, and on the right is the recognized text

In the past, I have written about using Python and Google Cloud Vision to recognize Tamil text in your own applications and getting Tamil text from printed books using the open-source Tesseract app.

#tamilocr #GoogleLens #GooglePhotos #tamiltext

Categorized in:

Tagged in:

,