எழுத்துருவை ஒருங்குறிக்கு மாற்றுவது எப்படி - 1
Google Buzz Logo

பகுதி 1
பகுதி 2
பகுதி 3
பகுதி 4


உங்களுக்கு பிடித்த அழகான தமிழ் எழுத்துரு ஒருங்குறி(Unicode) அல்லாத TAB/TAM அல்லது தனிப்பட்ட வேறு குறியேற்றங்கள் இருக்கிறதா? அதை நீங்கள் எளிய முறையில் ஒருங்குறிக்கு மாற்றியமைத்துப் பயன்படுத்த வேண்டுமா? அதற்கான வழிமுறைகளை ஆராயலாம்.

முதலில் எழுத்துரு குறித்த நுட்பங்களை விவாதிக்கும் முன்பாக இது தொடர்பான சில அடிப்படை நுட்பங்கள் பற்றி அறிந்து கொள்ளலாம்.

குறியேற்றங்கள்

கணினியில் அனைத்து வகையான உரையாடல்களும் எண்களாலேயே செய்யப்படுகின்றன என நாம் அறிவோம். அது போல எழுத்துக்களும் எண்களைக் கொண்டே குறிக்கப்படுகின்றன.

ஒரு குறியேற்றம் என்பது, மனிதரால் படித்தறியக் கூடிய எழுத்துக்களுக்கு, கணினியால் புரிந்து கொள்ளக் கூடிய வகையில் பொருத்தமான எண்களை ஒதுக்கித் தருவதே. உதாரணமாக, ஆங்கிலத்தின் 'A' என்ற எழுத்துக்கு ASCII குறியேற்ற அட்டவனைப்படி 65 என்ற எண் ஒதுக்கப்படுகிறது. ஒரு கணினியிலிருந்து இன்னொரு கணினிக்கு தகவல்களை கொண்டு செல்லும் போது இந்த குறியேற்ற அட்டவனையின்படி எழுத்துக்கள் எண்களாய் சேமிக்கப்பட்டு பின் மீண்டும் எழுத்துக்களாய் மாற்றி திரையில் காட்டப்படுகின்றது.

ASCII குறியேற்றம் எல்லா இயங்கு தளங்களிலும் முன்னரே நிறுவப்பட்டு விடுவதால் நீங்கள் ஆங்கில எழுத்துக்களை தட்டச்சிட்டு அந்தக் உரைக் கோப்பினை எந்தக் கணினியில் திறந்தாலும் பிரச்சனை இன்றி படிக்க இயலும். ஆனால் பிற குறியேற்றங்களைப் பொறுத்தவரை அந்த குறியேற்றத்தின் அட்டவனைப்படி எழுத்துருக்கள் நிறுவாத கணினிகளில் அவ்வாறு எழுத்துக்கள் மாற்றிக் காட்டப்படாமல் புரியாத எழுத்துக்களை காட்டும்.

இதை விளக்க, நடைமுறை ஒப்பீடாக 'நல்ல' என்ற தமிழ் வார்த்தையை எடுத்துக் கொள்வோம். இந்த வார்த்தைக்கு தமிழ் அறிந்த அனைவரும் பொருள் விளங்கிக் கொள்வர். அதே சமயம் 'நல்ல' என்று ஒரு தமிழ் அறியாத தெலுங்கு மொழி பேசுபவரிடம் சொன்னால் அதனை தெலுங்கிலே அவர் 'கருப்பு' என பொருள் கொள்வார். 'நல்ல' என்னும் வார்த்தை இரு மொழியிலும் இருப்பதால் பொருள் வேறாயினும் இருவரும் புரிந்து கொள்வர். ஆனால் தகவல் பரிமாற்றத்தில் குழப்பம் ஏற்படும். இருவருமே ஒரே மொழியை பேசுபவர்களாய் இருப்பின் இந்த குழப்பம் நேராது.

அது போல, கணினி தகவல் பரிமாற்றத்தில், பயனர்கள் அனைவராலும் ஒப்புக் கொள்ளப்பட்ட ஒரு குறியேற்றத்தை பயன்படுத்துவதன் மூலம் தகவல் பரிமாற்றக் குழப்பங்கள் தவிர்க்கப்படும்.

இன்றைய தமிழ்க் கணிமை உலகில் பல்வேறு குறியேற்றங்கள் பயன்பாட்டில் உள்ளன. அவற்றுள் சில:
  • தாம் (TAM - Tamil Monolingual)
  • தாப் (TAB - Tamil Bilingual)
  • திஸ்க்கி (TSCII - Tamil Standard Code for Information Interchange)
  • ஒருங்குறி (Unicode)
இந்த குறியேற்றங்களில் இன்று இணையத்தமிழில் பரவலாக பயன்படுத்தப்பட்டு வருவது ஒருங்குறி.

கணினி மயமாக்கப்பட்ட அரசு அலுவலகங்களில் பெரும்பாலும் தாம்/தாப் தகுதரம் பயன்பாட்டில் உள்ளது. அரசு சார் இணையதளங்களில் திஸ்கி பயன்படுத்தப்படுகிறது.

இது தவிர, அச்சு மற்றும் பத்திரிக்கை துறையினர் பல்வேறு தனிப்பட்ட தமிழ் குறியேற்றங்களையும் அதன் அடிப்படையில் அமைந்த எழுத்துருக்களையும் பயன்படுத்துகின்றனர்.

இந்த குறியேற்றங்களின் அட்டவனையை பார்த்தீர்களானால் ஒவ்வொரு தமிழ் எழுத்துக்கும் ஒரு எழுத்தெண் வழங்கப்படுவது தெரியும்.

படம் 1 தாம் அட்டவனை

படம் 2 தாப் அட்டவனை

படம் 3 திஸ்கி அட்டவனை

படம் 4 ஒருங்குறி தமிழ் அட்டவனை


சரி, இன்றைய இடுகையில் குறியேற்றங்கள் பற்றி அறிந்து கொண்டோம். இன்னும் சில எழுத்துரு தொடர்பான நுட்பங்களை பற்றி அடுத்த இடுகையில் அறிவோம்.

பகுதி 1
பகுதி 2
பகுதி 3
பகுதி 4

3 கருத்து(க்கள்):

கூடுதுறை |

உண்மையிலேயே மிக அற்புதமான மற்றும் மிகவும் தேவையானப்பதிவு

பல தமிழுருக்களால் நான் மிகவும் பாதிக்கப்பட்டுள்ளேன்.. நான் முழுக்க யூனிகோடு பழக்கமுள்ளவன்...

தயவுசெய்து உடன் அடுத்த பதிவை போடவும்


புருனோ Bruno |

கடைசியில் உள்ள சுட்டி
http://higopi.blogspot.com/2008/08/2.html

என்ற பக்கத்தை காட்டுகிறது

ஆனால் அதை சுட்டினால்
http://blog.higopi.com/2008/08/2.html

வராமல்

http://blog.higopi.com/index.html தான் வருகிறது.


ஏதோ குழப்பம் உள்ளது

நீங்கள் FTP பதிப்பு உபயோகிக்கிறீர்களா :) :)


கோபி(Gopi) |

கூடுதுறை,

நன்றி.

புருனோ,

ஆம். சில நாட்களுக்கு முன் தான் ப்ளாக்கரில் இருந்து FTP பதிப்புக்கு மாறினேன். சுட்டிகளை இப்போது சரியான முகவரிக்கு மாற்றி விட்டேன்