සිංහල යුනිකේත
පරිගණක යන්ත්ර ක්රියාකරනු ලබන්නේ විදුලිය ඇත නැත යන සංකල්පය යටතේයි. තවත් අතකින් පරිගණක ඇතුලු සියලු අංකිත ඉලෙක්ටොනික යන්ත්ර (Digital Electronic Devices) අංක මත පදනම්වූ ක්රම වේදයකින් ක්රියා කරන බව පැවසිය හැක. එසේ වුවද ඒවා භාවිතකරනුයේ මිනිසුන් බැවින් විවිද භාෂාවන් භාවිතා කරන්න සිදුවෙයි. මුල් කාලයේදී ඉංග්රිසි සහ වෙනත් භාෂාවන් කීපයකට පමනක් මෙය සීමාවුනත් මේ වෙන විට අනෙකුත් භාෂාවන් හී අක්ෂර ක්රමද පරිගණක ගත වෙමින් පවතී. සිංහල යුනිකේතය(Unicode) යනු සිංහල අකුරු ඉලෙක්ටොනික උපාංග(පරිගණක, දුරකතන ආදී) තුල හැසිරවීම සඳහා ඇති ජාත්යන්තර සම්මතයයි.
සිංහලයට සම්මතයක් අවශ්ය ඇයි?
මුල් යුගයේ ඉංග්රීසි අකුරු සඳහා පමණක් සම්මතයක් සකසා තිබූ නිසා සිංහල අක්ෂර, පරිගණකයෙන් ඇතුලත් කිරීමට ඉංග්රීසි අකුරු හැඩතල වෙනුවට සිංහල අකුරු හැඩතල ඇති අක්ෂර රටා (Font) නිර්මාණය වුනා. නමුත් විවිධ අක්ෂර රටා නිර්මාපකයින් තම තමන්ගේ අභිමතය පරිදි අකුරු සැකසීම සිදු කරනු ලැබුවා.
එක් සිංහල අකුරු රටාවක් ‘අ’ සඳහා ඉංග්රිසි ‘a’ අක්ෂරය පිහිටි තැනත්, තවත් සිංහල අකුරු රටාවක් විජේසේකර යතුරු පුවරුව අනුව යමින් ඉංග්රිසි ‘w’ අක්ෂරය පිහිටි තැනත් භාවිතා කළා. මේ ආකාරයට පරිගණකයෙන් කෙසේ හෝ සිංහල අකුරු ලිවීම කළ හැකි තත්වයට ගෙන ඒමට හැකිවු නමුත් සිංහල අකුර තවමත් තියෙන්නේ ඉංග්රිසි අකුරක් වෙනුවට. අනික් අතට විවිධ අක්ෂර නිර්මාණ ශිල්පීන් විවිධ ස්ථාන සඳහා සිංහල අකුරු(Font) නිර්මාණය කිරීම තත්වය තවත් අවුලෙන් වියවුලට ගෙනයන කාරණයක් වුනා. තත්වය එසේ වුවත් දැනටත් මෙම මාදිලියේ සිංහල අකුරු මුද්රණ මාධ්ය සඳහා බහුලව භාවිතා වෙයි.
පරිගණකය අක්ෂර මතක තබාගනුයේ ඒ ඒ අක්ෂරයට අදාළ සංඛ්යාමය අගයක් මගිනි. උදාහරණයක් ලෙස ඉංග්රීසි simple ‘a’ අක්ෂර සඳහා අනුරූප අගය වෙනුයේ 97 යි. අක්ෂර රටාවලින් (Font) මේ 97 යන අගයට විවිධ හැඩ තල දුන්නද, පරිගණකය තවමත් එය හඳුනනුයේ ඉංග්රීසි ‘a’ අක්ෂරය ලෙසමයි.
යුනිකේත අවශ්ය ඇයි?
යුනිකේත නොවන සිංහල අක්ෂර රටා සඳහා භාවිතා කළේ ඉංග්රීසි අකුරක් වෙනුවෙන් වෙන් කළ ඉඩ මයි. මිනිස් ඇසට සිංහල අකුරක් ලෙස හඳුනාගත හැකි වුවද පරිගණකය තවමත් එය හඳුනාගනුයේ ඉංග්රිසි අකුරක් ලෙසයි. මේ හේතුව නිසා පරිගණක වැඩසටහන් සඳහා සිංහල අකුරු සමග වැඩ කිරීමේදි ගැටළු රැසකට මුහුණදෙන්නට සිදුවෙනවෙයි. අක්ෂර දෝෂ හඳුනාගන්නා මෘදුකාංගය (spell checker) සිංහල අක්ෂර වලින් ඇතුලත් කර ඇති වදන් වැරදියැයි වරදවා දැක්වීම, අකාරාදී පිලිවෙලට (shorting) සැකසීමට නොහැකියාව, භාෂා කීපයක අක්ෂර එකවර භාවිතා කිරීමට නොහැකිවීම, භාවිතා කරන ලද Font ගොනුව(අක්ෂර හැඩතල) වෙනත් පරිගණකයකට ගෙනයන විට එම Font ගොනුව පිහිටවීම අත්යාවශ්ය වීම ආදී ගැටළු රැසකට මුහුණ දෙන්නට සිදුවේ.
මේ සියල්ලට විසඳුම යුනිකේත
යුනිකේත සමගින් සිංහල අක්ෂර සඳහා අනන්යවූ ස්ථානයක් ලබාදීම සිදු කරයි. මේ හේතුවෙන් පෙර පැවති සියලු ගැටළු විසඳා ගත හැකි වෙනු ඇත. යුනිකේත සියලුම සිංහල අක්ෂර සහ අක්ෂර රූප සඳහා අනන්යවූ ස්ථානයක්(අගයක්) ලබා දෙයි. සිංහල ‘අ’ අක්ෂරය සඳහා ලබාදී ඇති අනුරූපි අගය 3461 යි. 3461 අගය සිංහල “අ” අක්ෂර ලෙසම පරිගණකය හඳුනාගනී. සරලව කියතොත් මෙහිදී අක්ෂර රටාව(Font) මත යැපෙන්නේ නැත. මුල් ලිපිය යතුරු ලියනය කරන ලද යුනිකේත අක්ෂර රටාව පරිගණකයේ නැත්නම්, පරිගණකයේ ඇති ඕනෑම සිංහල සහිත යුනිකේත අක්ෂර රටාවකින් ඔබට සිංහල බලා ගැනීමට හැකි වනු ඇති.
සිංහල අක්ෂර මාලාව සංකීර්ණයි
සිංහල අක්ෂර මාලාවේ සැකැසුම සංකීර්ණයි. ඉංග්රීසි ලිවීම සඳහා භාවිතා කරනුයේ ලතින් අක්ෂරයි. ඉංග්රීසි භාෂාවේ පිලි නොමැති මුත්, බ්රාහ්මීය අක්ෂර වලින් සැකසුනු, සිංහල, දේවනාගර්(හින්දි), කාම්බෝජ, දෙමළ, තෙලෙඟු ආදී භාෂාවල ස්වර ව්යාංජන අක්ෂර සමග යෙදීමේදී විවිධ පිලි භාවිතා කරයි. සමහර අවස්ථාවලදී විවිධ සංයෝජන සඳහා වෙනමම අක්ෂර සංකේතයන් භාවිතා කරයි.
මේ නිසාම යුනිකේත සිංහල කරණයේදී විශේෂ තාක්ෂණික ක්රමවේදයන් කිහිපයක් භාවිතාකරනවා. මෙය තරමක් සංකීර්ණයි. සාමාන්ය පරිගණක පරිශීලකයින් පමණක් නොව බොහෝමයක් පරිගණක තාක්ෂණ වේදීන්ට පවා මේ පිලිබඳ ඇත්තේ අඩු වැටහීමක්.
යුනිකේත (Unicode)
මුලින් කීවාක් මෙන් යුනිකේතයනු ඕනෑම භාෂාවක් අක්ෂර පරිගණකය හරහා නිරූපණය කිරීමට යොදාගන්නා සම්මතයකි. මේ වන විට යුනිකේත සම්බන්ධ සියළු සම්මතයන් පවත්වගෙනු යනු ලබන්නේ යුනිකේත එක්තැන්සමිය (Unicode consortium) මගිනි. යුනිකේත භාවිතා කරන කවුරුන් හෝ එය භාවිතා කලයුත්තේ යුනිකොඩ් එක්තැන්සමිය විසින් ලබා දී ඇති නිර්දේශයන්ට අනුවයි. මේ හේතුවෙන් විවිද ආයතන හා විවිද පුද්ගලයන් විසින් නිර්මානය කරනු ලබන මෘදුකාංග එකම ප්රමිතියක් යටතේ ක්රියා කිරීමේ හැකියාව ලැබෙයි. දැනට යුනිකේත සම්මතය තුල ඒකීය අක්ෂර නිරූපණ 1114112 කට ඉඩ ලබා දී තිබේ.
සිංහල යුනිකේත
සිංහල යුනිකේත යනුවෙන් අපි හඳුන්වනුයේ යුනිකොඩ් සම්මතය මගින් සිංහල අක්ෂර සඳහා වෙන්කර ඇති ඉඩ ප්රමාණය සහ ඒ හා සබැඳි යුනිකේතයේ භාවිතාව යි. සිංහල, යුනිකේතයට ගෙන ඒමේ දී වර්තමානයේ හා අනාගතයේදී සිංහල අක්ෂර විද්යුත් මාධ්ය මගින් නිරූපණය කිරීමේදී ඇතිවන හෝ ඇතිවිය හැකි හෝ ගැටළු අවම වන ආකරයට නිර්මාණය කෙරින. ඒ සඳහා නූතන සිංහල හෝඩිය, සිංහල අකාරාදිය, සංකේත හා සලකුණු, ආදී නොයෙක් කාරනා සැලකිල්ලට ගෙන දැනට පවතින SLS 1134 දෙවන සංස්කරණය(2004) සකස්කර ඇත.
අක්ෂර නිරූපනය කිරිම සඳහා අංකමය ක්රමයක් භාවිතා වෙන බැව් අපි ඔබට සඳහන් කළා. ඒ අනුව යුනිකේතයේ සිංහල සඳහා අංක 3456 සිට 3583 දක්වා අක්ෂර 128 වෙන්ව ඇතත් සිංහල අකාරාදියේ අක්ෂර 61ද විවිද සංකේත හා අක්ෂර සමග සිංහල යුනිකේත වර්ණමාලාව සඳහා දැනට(SLS 1134 දෙවන සංස්කරනයට අනුව) අක්ෂර හා සංකේත 80ක් භාවිතා වේ.
සිංහල අකාරාදිය (වර්ණමාලාව)
නූතන සිංහල වර්ණමාලාව පිලිබඳ විවිද මත බේධනාත්මක අදහස් පවතී. සිංහල යුනිකේත නිර්මාණයේදී මේ සියලු කරුනු සැලකිල්ලට ගෙන ඕනෑම අක්ෂරයක් යුනිකේත මගින් යතුරු කරගත හැකි ආකාරයට සම්මතයක් ගොඩනා ඇත. ඒ අනුව යුනිකේත සිංහල වර්ණමාලාව පහත දක්වා ඇත.
පණකුරු(ස්වර)
අ ආ ඇ ඈ ඉ ඊ උ ඌ ඍ ඎ එ ඒ ඓ ඔ ඕ ඖ
සහ භාවිතයෙන් මෑත්වෙමින් පවතින ඏ ඐ ස්වර දෙක.
ගතකුරු (ව්යංජනාක්ෂර)
ක ඛ ග ඝ ඞ ඟ ච ඡ ජ ඣ ඤ ඥ ඦ ට ඨ ඩ ඪ ණ ඬ ත ථ ද ධ න ඳ ප ඵ බ භ ම ඹ ය ර ල ව ශ ෂ ස හ ළ ෆ
අනු පණකුරු
ං(අං) සහ ඃ (අඃ)
සිංහල යුනිකේත වර්ණමාලාව සඳහා නූතන හෝඩියේ අක්ෂර වලට අමතරව පහත සඳහන් අක්ෂර/සංකේත ද ඇතුලත්ව ඇත.
හල් කිරීම
් – ගත කුරක් හා එකට යෙදීමෙන් මූලික ගතකුරක් සකසා ගත හැක. (මූලික ගතකුරක් යනු ස්වරයක් සමග සම්බන්ද නොවූ ගතකුරයි. මූලික ගතකුරක් තනිව උච්චාරණය කළ නොහැකි නිසා නිරායාසයෙන්ම අ ස්වරය සෑම ගතකුරකට ඇතුලත් වී ඇත. සියලුම හල් අක්ෂර මූලික ගතකුරු වේ.)
ස්වර වෙනුවට ගතකුරක් සමග යෙදෙන පිලි හා සංකේත /ස්වර-සංකේත
ා ැ ෑ ි ී ු ූ ෘ ෙ ේ ෛ ො ෝ ෞ ෟ ෲ ෳ
ව්යාංජන අක්ෂර සමග උදාහරණ
ක් කා කැ කෑ කි කී කු කූ කෘ කෙ කේ කෛ කො කෝ කෞ කෟ කෲ කෟ
වෙනත් අක්ෂර හා සංඥා
෴ (කුන්ඩලිය) – සෙල් ලිපි වල නැවතීමේ ලකුණ ආකාරයට භාවිතා කරන ලද සලකුණක්.
සිංයල යුනිකේත තාක්ෂණය
‘සි’ අක්ෂරය ‘ස’ ගතකුර සහ ‘ඉ’ ස්වරයට අදාළ පිල්ල වන ඉස්පිල්ල (“ ි”) යන අංගයන් දෙක සංයෝජනයෙන් සකස් වී ඇත ඒ ආකාරයටම ක, ල, ද, ර, වැනි ගතකුරු සඳහා ‘උ’ ස්වරයට අදාල පිල්ල එකතු වීමෙන් කු,ලු,දු,රු යන අක්ෂර රූපය ලැබෙනවා. සෑම පිල්ලක්ම යම් කිසි ස්වරයක් සංකේතමය වශයෙන් දක්වයි. පිල්ලක් මින් නිරූපණය කරන ස්වරය යෙදෙන ස්ථානය අනුව වෙනස් වේ. උදාහරණයක් ලෙස ඇලපිල්ල(ැ) සෑම අවස්ථාවකදීම ‘ඇ’ ස්වරය පෙන්වුවද. ‘ර’ අක්ෂරයට පසුව යෙදනවිට ‘උ’ ස්වරය නිරූපණය කරයි.
යුනිකේතයද අනුගමනය කරන්නෙ මේ රටාවයි. යුනිකේත සිංහල අකුරු කොටස් කීපයකට වෙන් කරගනී. එනම් ගතකුරු, ස්වර, ස්වර සංකේත, ආදීලෙසයිි. යුනිකේතය සෑම විටම අක්ෂරයක් ඇතුලත් කිරීමේදී මුලින් ගතකුරත් පසුව ස්වර සංකේතයත් ඇතුලත් කරගනී. ඒ අනුව මි, රි, දු වැනි අක්ෂර තනි යුනිකේත අක්ෂරයකින් නිරූපණය නොවේ. “යුනිකේත දර්ශකය” නම් විශේෂ මෘදුකාංගයක් මගින් ඒවා තිරයේ දී හෝ මුද්රණයේදී තනි අක්ෂරයක් බවට පත් කරයි.
කොම්බුව විශේෂයි
බොහෝමයක් බ්රාහ්මීය මූලය ඇති භාෂාවන් වල “එ” ස්වරය වෙනුවට භාවිතා කරන ස්වර සංකේතය වන කොම්බුව අනෙක් ස්වර සංකේතවලට වඩා විශේෂයක් දක්වයි. සාමාන්යයෙන් අනෙකුත් ස්වර සංකේත(පිලි) ගතකුරකට උඩින්, පැත්තකින් හෝ යටින් එකතු වනමුත් කොම්බුව එකතු වන්නේ ගතකුරකට පෙරයි.
යුනිකේත මේ සඳහා අපූර්ව ක්රමයක් භාවිතා කරයි. කොම්බුවක් සහිත ගතකුරක් පරිගණකයේ ගබඩාකර ගනුයේ අනෙකුත් ස්වර සංකේත(පිලි) ලෙසටම ගතකුරට පසුවයි. නමුත් අක්ෂර පරිගණක තිරයේ දිස්වීම සිදු වෙනුයේ අප බලාපොරොත්තු වෙන ආකාරයටම කොම්බුව මුලටත් ගතකුර පසුවත් යෙදෙන ලෙසටයි. සමහර අය නොදැනුවත්කම නිසා මෙය සිංහල යුනිකේතයේ දුර්වල තාවයක් ලෙස දකියි. නමුත් කොම්බුව අකුරක මුලට යෙදුනලෙස අන්තර්ගතය සකස් කළහොත් සිංහල අකාරාදිය පිලිවෙලින් සකස් කිරීමට නොහැකි වෙනු ඇත.
බැඳි අකුරු, යංසය, රේපය සහ රකාරාංශය
සිංහල භාෂාවේ බැඳි අකුරු, යංසය, රේපය සහ රකාරාංශය ආදී සුවිශේෂ අංශයන් සිංහල යුනිකේතටද ඇතුලත් කොට ඇත. මේ සඳහා zero width joiner නම් විශේෂ අක්ෂරය භාවිතා කරයි. මේ සඳහා තරමක් සංකීර්ණ තාක්ෂණ ක්රමවේදයක් අනුගමනය කරන බැවින් ඒ පිලිබඳ වැඩි විස්තර http://www.unicode.org/ අඩවියෙන් ලබාගත හැක.
සිංහල යුනිකේත භාවිතා කරන ඔබට වැදගත් වෙබ් අඩවි
රජයේ නිල වෙබ් අඩවි
http://www.siyabas.lk/ සහ http://locallanguages.lk/
සිංහල යුනිකේත ගැටලු විසඳා ගැනීම සඳහා
http://groups.google.com/group/sinhala-unicode ගූගල් සමූහයට පිවිසිය හැක.
සිංහල යුනිකේත සහ වෙනත් තාක්ෂණික ගැටලු සඳහා http://groups.google.com/group/techkatha
සිංහල බ්ලොග් අඩවි නැරඹීම සඳහා
http://sinhalabloggers.com/
සිංහල වෙබ් අඩවි සොයාගැනීම සඳහා
www.sinhalawebdirectory.com/
නිල Unicode වෙබ් අඩවිය
http://www.unicode.org/
පරිගණකයේ පිහිටවීම
ඔබ සතුව ඇත්තේ Windows XP පද්ධතියක්නම් සිංහල යුනිකේත වෙනමම පිහිටවා ගත යුතුය. ඒ සඳහා http://locallanguages.lk/sinhala_how_to_install_in_english.html යන ලිපිනයට පිවිසෙන්න. Windows Vista, Windows Server 2008 හෝ Windows 7 පද්ධතියක් නම් සිංහල යුනිකේත පිහිටවීමක් අවශ්ය නොවේ. නමුත් සිංහල අක්ෂර යතුරු ලියනය කිරීම සඳහා කුඩා මෘදුකාංගයක් ස්ථාපනය කළ යතුය. ඒ සඳහා http://www.siyabas.lk/files/SinhalaTamil_IME_Setup.exe අඩවියට පිවිසෙන්න. තව දුරටත් සිංහල පරිගණකියේ පිහිටවීම සඳහා සියලු උපදෙස් ඉහත සඳහන් කරන ලද වෙබ් අඩවි වලින් ලබාගත හැක.
සිංහල යුනිකේත අක්ෂර යතුරු කරනය
සිංහල අක්ෂර යතුර කිරීමේ සම්මත යතුරුපුවරුවේ සිංහල අක්ෂර පිහිටා ඇති ආකාරය පහත දැක්වේ.
http://www.siyabas.lk/docs/sin-kbd-layout5.pdf
සිංහල අක්ෂර යතුරු කිරීම සඳහා වඩාත් වේගවත්ම සහ පහසුම ක්රමය සම්මත විජේසේකර යතුරුපුවරුවයි. ඒසේ වුවත් වෙනත් ආකාරයේ යතුරු ලියන ක්රමද භාවිතා වේ. යතුරුපුවර ගැන වැඩි විස්තර සඳහා http://www.siyabas.lk/sinhala_unicode_keyboards අඩවියට පිවිසෙන්න.
ලීවේ: දසුන් සමීර වීරසිංහ