சனி, மே 06, 2017

தமிழாய்வின் செம்மைக்குக் கணினித் துறை

தமிழாய்வின் செம்மைக்குக் கணினித் துறை

முனைவர் மு.பழனியப்பன் 

Siragu tamil in computer2
தமிழாய்வின் செம்மைக்குக் கணினியின் துணை என்பது தவிர்க்கமுடியாததாகிவிட்டது. தகவல்கள் திரட்டல், பதிதல், ஆராய்தல், ஒழுங்குபடுத்தல், எண்ணிக்கையிடல் போன்ற பணிகளுக்கு இன்றைக்குக் கணினி மிக மிக அவசியமானதாக இருக்கிறது. கணினி உதவியுடன் செய்யப்படாத தமிழ் ஆய்வுகளின் துல்லியத்தன்மை சந்தேகத்திற்கு இடமாகின்ற அளவிற்கு கணினி உதவி தேவைப்படுவதாக உள்ளது.
தமிழ்மொழியின் சொல்வளம், தொடர் கட்டமைப்பு, பொருள் வளம் மிக முக்கியமான முன்னேற்றத்தை இன்னும் சில காலங்களில் பெறப்போவதற்கான அறிகுறிகள் தற்போது தெரிகின்றன. தமிழகம் சார்ந்த கணினி அறிஞர்கள், கணித அறிஞர்கள், பிறதுறை அறிஞர்கள் ஆகியோரின் வருகை தமிழின் அக, புற வளர்ச்சிக்கு உறுதுணையாக விளங்குகின்றன.
குறிப்பாக சொல்லகராதி, தொடரடைவு அகராதி, பொருளடைவு அகராதி ஆகியன மின்மயமாக்கப் பெற்றுவரும் இச்சூழல் தமிழ் ஆய்வு வளர்ச்சிக்கு பெரிதும் துணை புரிவதாக உள்ளது. சொல்லகராதிகள் அச்சு ஊடக அமைப்பில் இருந்தவரை அவற்றினைப் பயன்படுத்தல் என்பது எல்லார்க்கும் வாய்க்காத, எளிமையில் அடைய முடியாததாக இருந்தது. தற்போது பல அகாரதிகள் மென்பொருள்களாகவும், ஒளிப் பட அளவிலும் கிடைப்பது சொல்லாய்வில் ஏற்பட்டுள்ள குறிக்கத்த மாற்றம் ஆகும். இதனைத் தொடர்ந்து கணினி வழியான தொடரடைவு மக்கள் மயமாக்கப்பெற்றுள்ளது. பொருளடைவு என்பதும் முதற்கட்ட வளர்ச்சியைப் பெற்றுள்ளது.
சொல் பொருள் விளக்கம், சொல் இடம் பெற்றுள்ள பாடல் எண் போன்றவற்றைத் தருவது சொல்லடைவு ஆகின்றது. சொல்லோடு அச்சொல் இடம்பெற்றுள்ள தொடரையும் தருவது தொடரடைவு ஆகின்றது. தொடரோடு அச்சொல் வந்துள்ள சூழல் போன்றனவற்றைத் தருவது பொருளடைவு என்பதாகக் கொள்ளலாம்.
மின் தொடரடைவுகள்
Siragu tamil in computer3
தற்போது தமிழ் இலக்கியத்தில் இடம் பெற்றுள்ள சொற்களின் தொடர்களைப் பெற மதுரை அமெரிக்கன் கல்லூரியின் முன்னாள் கணிதத்துறைப் பேராசிரியர் பாண்டியராஜா அவர்களின் http://tamilconcordance.in/ என்ற தளம் பெரிதும் உதவுகிறது. இதன்வழி ஐம்பது நூல்களுக்கான தொடரடைவுகள் கிடைக்கின்றன. குறிப்பாக ஒரு ஆய்வாளர் ‘சங்க இலக்கியத்தில் மான்’ என்பது பற்றி ஆராய விரும்பினால் அவர் சங்க இலக்கியப்பகுதிக்குச் சென்று “‘மா” என்ற எழுத்தைச் சொடுக்கி அதன் வழி மான் என்ற சொல் எத்தனை தொடர்களில் வந்துள்ளது என்பதைக் கண்டறிந்து அதனைத் தன் தரவுகளாக மாற்றிக் கொள்ள இயலும்.
மான் என்ற சொல் சங்க இலக்கியங்களில் நூற்று இருபத்தைந்து இடங்களில் இடம் பெற்றுள்ளதாக இத்தொடரடைவு காட்டுகிறது. இவை மட்டும் முழுமையான தகவல்கள் அல்ல. மானே என்றோ, மானை என்றோ, மானோ என்றோ இடம் பெறும் சொற்களிலும் மான் பற்றிய குறிப்பு காணப்படலாம். எனவு அவ்வாறு சொல்லுருப்புகளுடன் உள்ளவற்றையும் தரவுகளாக ஆக்கிக்கொள்ள வேண்டும். மான் என்ற நூற்று இருபத்தைந்து தொடர்களும் மான் என்று குறித்துவிடுகிறது என்று எண்ணவும் இயலாது. மானிற்கு இலக்கிய வழக்கில் பிணை, எவ்வி போன்ற பெயர்களும் உண்டு. இவற்றையெல்லாம் கணக்கில் கொண்டு தரவுகளை ஓர் ஆய்வாளன் ஆக்கிக் கொள்ளவேண்டும்.
இத்தளத்தில் மேலும் இரு சிறப்புச் சொல்லடைவுகள் இடம்பெறுவதற்கான வாய்ப்புகள் உள்ளன. பத்துப்பாட்டிற்கு மட்டும் சொல் வகுப்புத் தொடரடைவு என்பது தரப்பெற்றுள்ளது. இதன் காரணமாக சொற்களை வகை பிரித்து அறிந்து கொள்ள இது வாய்ப்பளிக்கிறது. அகல் என்ற சொல் வினையாகவும், பெயரடையாகவும் அமையலாம், சிறு பாத்திரத்தைக் குறிப்பதாகவும் அமையலாம். எனவே அகல் என்பது வினைச்சொல்லாக வரும் நிலையில் பாடப்பட்டுள்ள இடங்களை ஒரு பிரிவாகவும், பெயரடையாக வரும் இடங்களைத் தனிப் பிரிவாகவும், பாத்திரத்தைக் குறிக்கும் நிலையில் ஒரு பிரிவாகவும் வகுத்து சொற்களை நிரல்படுத்தும் முறை சொல்வகுப்புத் தொடரடைவு எனப்படும்.
மற்றொரு தொடரடைவு கூட்டுத் தொடரடைவு எனப்படும். பல நூல்களை ஒன்றிணைத்துப் பெறப்படும் தொடரடைவு கூட்டுத் தொடரடைவு எனப்படும். இத்தொடரடைவு இதுவரை தமிழ் இலக்கியங்கள் அனைத்தும் ஒருங்கிணைத்துச் செய்யப்பெற்றால் ஒட்டுமொத்த தமிழ் இலக்கியங்களின் சொல் பயன்பாட்டு நெறி கிடைத்துவிடும். சங்க காலத்தில் பயன்படுத்தப்பட்ட காதலர் என்ற சொல் இக்காலம் வரை எப்படிப் படைப்பாளர்களால் காலம், இடம் கருதி பயன்படுத்தப்பட்டது என்பதை அறிந்து கொள்ள இயலும். தற்போது ஒன்றிரண்டு நூல்களுக்கான கூட்டுத் தொடரடைவுகளைப் பாண்டியராஜா தன் தளத்தில் வழங்கியுள்ளார். சங்க இலக்கியங்களுடன் பிற இலக்கியங்களை இணைத்துக் காட்டும் கூட்டு முயற்சியாக இது விளங்குகின்றது. இதன்வழி இரு நூல்களுக்கு இடையிலான தாக்கம் போன்றனவற்றை அறிந்து கொள்ளமுடிகின்றது.
எடுத்துக்காட்டிற்கு குடில் என்ற சொல் சங்க இலக்கியத்திலும் கம்பராமாயணத்திலும் இடம்பெற்றுள்ளது.
‘‘புது வை வேய்ந்த கவி குடில் முன்றில் – பெரும் 225
குடி புக்கால் என குடில் புக்கார் கொடி அன்ன மடவார் – கம்.பால:15 12/4”
என்ற நிலையில் இரு இலக்கியங்களில் குடில் என்ற சொல் பயின்று வந்துள்ளது. இதன் காரணாக சங்க இலக்கியத் தாக்கம் கம்பராமாயணத்தில் சொல் அளவில் இருந்துள்ளது என்பதை உணரலாம்.
இவ்வாறு இலக்கியங்கள் தோறும் சொற்கள் ஆளப்பட்டு வந்துள்ள நெறியை இதன் வழி ஆராய இயலும்.
டாக்டர் காமாட்சி என்பவர் உருவாக்கியுள்ள சங்கம் கார்ப்பஸ் மற்றும் கன்கார்டன்ஸ் என்ற மென்பொருளில் சொல்லைப் புகுத்தி அவை இடம்பெற்ற தொடர்களைப் பெற இயலும். இது சங்க இலக்கியத்திற்கு மட்டும் அமைந்துள்ளது. இதன் வடிவமைப்பு வண்ணமுற வடிவமைக்கப்பெற்றுள்ளது. http://drkamatchi.in/Default.aspx என்ற தளத்தில் இச்சொல்லடைவினைப் பெற இயலும்.
செம்மொழித் தமிழாய்வு மத்திய நிறுவனம் மற்றொரு வாய்ப்பினை வழங்குகிறது. சொல்லடைவு மென்பொருளை உருவாக்கி வைத்துள்ளது. சொல்லடைவி 01 என்ற மென் பொருளை நிறுவிக் கொண்டால் எந்த நூலிற்கும் சொல்லடைவினைப் பயனாளர் உருவாக்கிக்கொள்ள இயலும். டிஎக்ஸ்டி கோப்பாக உள்ளனவற்றிற்கு இது பொருந்தும். பெரும்பாலும் நூல்கள் எழுதுவோர் ஒரு காலத்தில் சொல்லடைவு தருவார்கள். அதனை அமைக்க இம்மென்பொருள் பயன்படும்.
பொருளடைவு முன் முயற்சிகள்
Siragu tamil in computer4
தமிழ் ஆய்வுலகில் பொருளடைவு மின்னாக்கம் என்பது வளர்ந்துவரும் நிலையில் உள்ளது. இலக்கணக் குறிப்புகளை வழங்கும் விரிதரவு ஒன்றினைத் தமிழ் இணையக் கல்விக்கழகம் வழங்கியுள்ளது. http://www.tamilvu.org/coresite/html/cwannotate.htm இதன்வழி,
• தமிழ் இலக்கியங்களுக்கான இலக்கணக் குறிப்புடன் கூடிய தேடுதல்
• தொடரியல் மற்றும் பொருண்மையியல் விளக்கத்துடன் கூடிய தமிழ் விரிதரவு
• சொல், இலக்கணம், பொருளுடன் தமிழ் இலக்கியங்கள்
ஆகிய நிலைகளில் தரவுகளைப் பெறஇயலும். ஐம்பதிற்கும் மேற்பட்ட நூல்களில் உள்ள இலக்கணக் குறிப்புகளைச் சொற்களை உள்ளிட்டுப் பெற இயலும்.
தொடரியல் விரிதரவு என்பது எழுவாய், பயனிலை ஆகியவற்றினைக் காட்டுவதாகவும், அவற்றின் எண்ணிக்கையைக் காட்டுவதாகவும் அமைகிறது. மேலும் தொடர் நிலையில் பெயர்த் தொடர், பெயரடைத் தொடர், சொல்லுருபு தொடர் ஆகியவற்றை இனம் காண இயலும். எச்சத்தொடர் நிலையில் பெயரெச்ச, வினையெச்ச, குறையெச்ச, நிபந்தனையெச்சத் தொடர்களை இனம் காண இயலும். இதே தொகுப்பில் பொருண்மை நிலை என்ற பகுதியும் அமைந்துள்ளது. உவமை, உருவம், ஒருபொருள் பன்மொழி, எதிர்ச்சொல் ஆகியவற்றை அறிந்து கொள்ளும் விரிதரவாகவும் இது அமைகிறது.
சொல் இலக்கணம் பொருளுடன் தமிழ் இலக்கியங்கள் என்ற பகுப்பில் பாடல் முழுவதும் தரப்பெற்று ஒவ்வொரு சொல்லிற்கும் தலைச்சொல், இடம் சுட்டிய பொருள், சொல்லின் வகை ஆகியன தரப்பெறுகின்றன. இதில் கூட்டு நிலை இல்லை என்பது ஒரு பின்னடைவு.
இவ்வகையில் சொல், தொடர், பொருள் என்ற அடிப்படையில் தமிழ் இலக்கியங்களை ஆராய பெரும் வாய்ப்பாக தற்போது மென்பொருள் உலகம் சிறந்து வருகிறது. இதனைப் பயன்படுத்திக் கூர்மையான ஆய்வுகளைத் தரவேண்டியது தமிழ் ஆய்வாளர்களின் கடமை.

thanks to siragu.com

கருத்துகள் இல்லை: