• Tesseract OCR for Tamil text in PDF
    Making a PDF ebook with Tamil text searchable and to get a clean scan copy

    சில நாட்களுக்கு முன் நண்பர் மணி மணிவண்ணன் அவரது பேஸ்புக் பக்கத்தில், தமிழ்நாட்டுப் பாடநூல் நிறுவனம், சென்னை, 1985இல் வெளியிட்ட”தமிழ்‌- தமிழ்‌ அகரமுதலி” என்ற நூல் இலவசமாக மின் புத்தக வடிவில் கிடைக்கிறது எனவும், அதன் இணைப்பையும் கொடுத்திருந்தார். பயனுள்ள நூல் இது. உடனே பதிவிறக்கம் செய்தேன். தமிழ் இணையக் கல்விக்கழகம் இந்த நூலை நல்ல முறையில் வருடி, நகல் எடுத்திருக்கிறார்கள். ஒரே ஒரு குறை, மின் நூலில், தமிழில் தேட முடியவில்லை – அது ஏனென்றால், எளிதாகக் கிடைக்கும் ஒளி எழுத்துணரி செயலிகளில், தமிழ் இப்போது தான் வந்திருக்கிறது. அதனால் இறக்கம் செய்த மின் நூலை தேசாரக்ட் என்னும் இலவச செயலியைக் கொண்டு ஒளி எழுத்துணரிச் செய்து புதிய பதிவாகக் கொடுத்துள்ளேன். அதை எப்படிச் செய்தேன் என்பதைக் கீழே சொல்லியுள்ளேன். Recently my friend Mr Mani Manivannan had shared a link to download for free, a Tamil-Tamil-Dictionary published in 1985 by Tamil Nadu Text Book…

  • செயல் விளக்கம்
    Tools & Applications available for Tamil

    I was invited to present a guest talk for the annual Tamil Internet Conference 2019, that is underway at Anna University, organized by INFITT along with Tamil Virtual Academy and others. I presented a talk with demos titled aptly as “செயல் விளக்கம்” – Demonstration of tools for Tamil for writing and coding. I demonstrated the following: Google Voice Typing in Tamil on your PC – கூகுளின் குரல்வழித் தமிழில் உள்ளிடல் வசதி. How to use Tesseract, the open-source OCR engine to convert scanned pages in Tamil to PDF with Embedded Text (in Tamil) feature enabled, so that search in Tamil and copy and paste of text works. I will write a post…

  • Windows Batch file to backup IIS wwwroot using 7Zip
    A Windows batch file to do a simple backup of a WordPress site

    I have a production WordPress blog site that is hosted on IIS & Windows Server 2016. To do regular backups of the web folder and the MySQL database, I use the super-useful WordPress Plugin – UpdraftPlus. It creates backup files and uploads them automatically to Google Drive/One Drive/AWS/DropBox & more. Once in a year or so, I do a manual backup, which involves me (manually) selecting the folders, then running 7-Zip to create the backup files. Every time I do this, I have to remember to exclude the UpdraftPlus temporary folder, otherwise, the resulting backup file will be ginormous as they will be including the huge UpdraftPlus backup files. Today,…

  • Sample in Python for Tamil Speech

    Python code snippets for Speech in Tamil

    Using Python is fun. In a matter of minutes, I was able to build a rudimentary speech to text recognition app, for Tamil. And after that, in reverse, that is, to speak out loud a sentence of given Tamil text. Speech to Text: I got the base code from here. You need to install SpeechRecognition package (available through PIP) and PyAudio (available through PIP in Linux, but on Windows, you need to install appropriate package from here). Text to Speech: When I posted the above code, I got a reader request for a code that does the reverse – to speak out loud a sentence of given Tamil text. I…

    Oulook 2007 Command Switches

    If you are like me who has multiple mail profiles configured in Outlook 2007, you will be tired of selecting the profile everytime. Instead using command-line switches (parameters) for Outlook.exe you can create a shortcut for each profile that you want to run. For example I have a Profile (configured using the Mail Applet in Control Panel) named “Vishwak” and another named “Hotmail”. So to run the Vishwak Profile I create a Shortcut that points to:“C:\Program Files\Microsoft Office\Office12\OUTLOOK.EXE” /profile Microsoft Needless to say, the above path is specific to my Vista with Office 2007 machine. To learn on more switches and what they can do read this article from Office…