Chatbots and NLP for Tamil

தமிழ் இணையக் கல்விக்கழகம் அதன் கணித்தமிழ்ப் பேரவை சார்பாக இந்த வாரம் “இயற்கை மொழியாய்வுப் பயிலரங்கம்” ஒன்றை நடத்துகிறார்கள். இது முழுக்க முழுக்க ஆய்வாளர்கள் மற்றும் கல்வியாளர்களுக்கான கோடை முகாம் நிகழ்ச்சி. இதில் எனக்கென்ன வேலை என்கிறீர்களா?. கணினி தொழில்துறையிலிருப்பவர்கள் தமிழ் இயற்கை மொழியாய்வை எப்படிப் பார்க்கிறார்கள், அதன் வருங்காலப் பயன்பாடுகள் அவர்களின் பார்வையில் என்ன, என்ற தலைப்பில் இன்று என்னை பேச அழைத்தார்கள். நானும் எனக்கு தெரிந்ததை ஒரு முப்பது நிமிட அமர்வில் பகிர்ந்துக் கொண்டேன்.

Tamil Virtual Academy had organized a Natural Language Processing (NLP) workshop this week for academicians and researchers. I gave an invited talk for 30 minutes on why the software industry cares about developments in Tamil NLP and the applications of it.


I focussed on recent developments in Chatbots and introduction of Bot Framework from Microsoft, Facebook Messenger and how to write skills for Amazon Echo. In all these areas currently Indic languages including Tamil are lagging behind, but the frameworks allow third parties to plugin individual understanding to make them relevant for vernacular speakers.

I started my talk with what’s out there in conversation interfaces – Apple’s Siri, Microsoft’s Cortona and Amazon’s Echo. Then I played a small video by Amazon introducing their Echo device, why I think ChatBots and Conversation interface are going to gain currency. Worldwide in April 2016 the top 3 messaging platforms (WhatsApp, Facebook Messenger and Tencet QQ Mobile) combined together had 3 Billion users, showing the popularity of chat.

You can download the PowerPoint I used titled “Why Industry cares about NLP for Tamil?“.


After my talk, my good friend Muthu Nedumaran (Author, Murasu Anjal) presented on his journey of last many decades on developing software for Tamil, his recent developments in Mobile App. The latest version of Tamil keyboard app Sellinam has many improvements including predictive input and ability to input any Kural from entire Tirukural easily. He demonstrated a new app he is working on that can recognize Tamil handwriting. He then explained on what made all these were various computer science algorithms including $P algorithm, BigramEdit Distance.