ការបញ្ចូលអក្សរខ្មែរក្នុងយូនីកូដ ឯកសារឆ្នាំ 1996

ត្រួសៗអំពីយូនីកូដ

យូនីកូដ ឬ Unicode ជាប្រព័ន្ធស្តង់ដារកត់ត្រាតួអក្សរនៅក្នុងប្រព័ន្ធកុំព្យូទ័រ (Character Encoding Standard) ដែលមានប្រើយ៉ាងទូលំទូលាយនៅពេលបច្ចុប្បន្ន។ ដោយសារពីអតីតកាល មិនទាន់មានប្រព័ន្ធស្តង់ដារមួយដើម្បីកត់ត្រាតួអក្សរនានាលើពិភពលោកក្នុងកុំព្យូទ័រ ទើបបណ្ដាលឱ្យប្រទេសមួយចំនួនត្រូវបង្កើតប្រព័ន្ធកត់ត្រាតាមរបៀបរៀងៗខ្លួន ដោយមិនឈរលើមូលដ្ឋានណាមួយរួមគ្នា។ យូនីកូដ មិនសំដៅលើពុម្ពអក្សរឬម៉ូដអក្សរនោះទេ។

ហេតុនេះ ដើម្បីឱ្យអក្សរនៃប្រទេសទាំងនោះបង្ហាញបានរវាងកុំព្យូទ័រនានា គេត្រូវតែប្រាកដថាកុំព្យូទ័រនោះមានដំឡើងប្រព័ន្ធកត់ត្រាសម្រាប់អក្សរនោះដែរ។

តួយ៉ាង គេបានបង្កើត TIS-620 និង ISO/IEC 8859-11 សម្រាប់អក្សរថៃ, ISO/IEC 8859-6 សម្រាប់អក្សរអារ៉ាប់, TSCII សម្រាប់អក្សរទមិល។ល។ នៅមានប្រព័ន្ធកត់ត្រាជាច្រើនផ្សេងទៀតដែលគេបានបង្កើតឡើងកាលពីមុន ដែលខ្លះមាននៅប្រើ ហើយខ្លះទៀតប្ដូរមកប្រើជាយូនីកូដហើយ។

ការបង្កើតស្តង់ដារផ្សេងៗគ្នាដូច្នេះ មានបញ្ហាបច្ចេកទេសផ្សេងៗដែលអាចកើតមានឡើងនៅពេលប្រើប្រព័ន្ធអក្សរផ្សេងចូលគ្នា ដូចជាការសរសេរ ថៃ អារ៉ាប់ ទមិល ក្នុងឯកសារជាមួយគ្នាជាដើម។

ដូច្នេះហើយទើបក្រោយមក ក្រុមការងារយូនីកូដ បានកកើតឡើង ដើម្បីបង្រួបបង្រួមប្រព័ន្ធសំណេរនានានៅលើពិភពលោកចូលគ្នា ដោយឈរលើមូលដ្ឋានតែមួយ ដែលអនុញ្ញាតិឱ្យកុំព្យូទ័រសព្វថ្ងៃបង្ហាញប្រព័ន្ធអក្សរផ្សេងៗជាមួយគ្នាបានយ៉ាងងាយស្រួល។

ការបញ្ចូលអក្សរខ្មែរក្នុងប្រព័ន្ធយូនីកូដ

ការងារបញ្ចូលអក្សរខ្មែរទៅក្នុងប្រព័ន្ធយូនីកូដនៅកំឡុងឆ្នាំ ១៩៩៦ ដែលមានលោក Maurice Bauhahn ជាអ្នកទទួលបន្ទុកពីភាគីយូនីកូដ និងក្រុមអ្នកស្រាវជ្រាវនិងបញ្ញវន្តខ្មែរដូចជា សាស្ត្រាចារ្យ ថោង ធែល, បណ្ឌិត ឡុង សៀម, ឯកឧត្ដម ឈន អៀម, លោក ពិត ចំណាន, លោក ចន្ទ មនោ, លោក សូ មុយឃៀង, លោក លី សុវីរ, បណ្ឌិត នៅ ស៊ុន, លោក អុក ធួន, បណ្ឌិត ប៊ិត សៀងលីម។

ការបញ្ជាក់ពីក្រុមបញ្ញវន្តខ្មែរនៅក្នុងវេលានោះ ជាឯកសារដ៏សំខាន់មួយ​ដែលឈានទៅរកការបង្កើតប្លុកអក្សរខ្មែរក្នុងតារាងយូនីកូដ 1780-17FF ក្នុង Unicode 3.0.0 ខែកញ្ញា ឆ្នាំ១៩៩៩។1

រូបភាពពីគេហទំព័រ Khmer Keyboard, 2014 2

នៅក្នុងឯកសារនេះ លោកអ្នកបញ្ញវន្តខ្មែរបានលើកឡើងអំពីចំណុចមួយចំនួនដែលគួរឱ្យចាប់អារម្មណ៍។

ស្រៈពេញតួជាជើង – នៅក្នុងទំព័រទី២ គេបានបញ្ជាក់ថា ឧ, ឫ និង ឯ អាចមានសភាពជាសញ្ញាជើងបានដែរ។ ការសរសេរ ឧ និង ឯ ជាជើង ភាគច្រើនមាននៅសម័យខ្មែរកណ្ដាល។ ចំណែក ឫ វិញ ខ្មែរយើងប្រើតាមសំស្ក្រឹតតាំងពីសម័យមុនអង្គរមកម្ល៉េះ។

ស្រៈនិស្ស័យ ឿ – ក្នុងយូនីកូដខ្មែរបច្ចុប្បន្ន គេប្រើស្រៈ ឿ ក្នុងទម្រង់ដូច្នេះ ប៉ុន្តែមិនមានប្រឡោះដោយឡែកសម្រាប់ទម្រង់ េ + ឺ នោះឡើយ។ យ៉ាងណា គេអាចសរសេរឱ្យបង្ហាញបានជា កេឺ បាន។ ករណីនេះស្រដៀងការសរសេស្រៈនិស្ស័យ ើ និងទម្រង់មួយទៀត េ + ិ ឬ កេិ។

សញ្ញា ៛ មានក្បៀស – បើយើងអានសៀវភៅនិងទស្សនាវដ្ដីខ្មែរចាស់ៗ គេនិយមសរសេរតម្លៃជារបៀប ១២ រ, ៥០ (សញ្ញាក្បៀសត្រូវនៅក្រោមអក្សរ រ) ដែលអានថា ១២ រៀល ៥០ សេន។ ហើយសម័យក្រោយខ្លះមកទៀត ក៏មានសរសេរជាសញ្ញា ៛ (រ មាន វះពោះ) ហើយមានសញ្ញាក្បៀសក្រោមដែរ។ ប៉ុន្តែបច្ចុប្បន្ននេះ យើងលែងមានប្រើ​ឯកតា «សេន» ទៀតហើយ និងប្រើត្រឹមតែ ៛ ប៉ុណ្ណោះ។

ការបញ្ជាក់ពីក្រុមការងារនិងបញ្ញវន្តខ្មែរនាពេលនោះ គឺជាចំណុចចាប់ផ្ដើមមួយដ៏សំខាន់ដែលឈានទៅរកវត្តមានជាផ្លូវការរបស់យូនីកូដខ្មែរ ដែលយើងកំពុងប្រើប្រាស់នាពេលបច្ចុប្បន្ននេះ។

យ៉ាងណា នៅមានរឿងមួយចំនួនទៀត ដែលមិនទាន់មានការពិភាក្សាទូលំទូលាយដើម្បីបង្កើនប្រសិទ្ធភាពរបស់យូនីកូដខ្មែរ តួយ៉ាង ការកត់ត្រាភាសាខ្មែរបុរាណ ភាសាខ្មែរកណ្ដាល និងភាសាជនជាតិដើមភាគតិច ដែលភាសាទាំងនេះសុទ្ធតែប្រើប្រាស់អក្សរខ្មែរ ហើយមានក្បួនកត់ត្រាផ្សេងៗគ្នា។

អានបន្ថែម

  1. Khmer Character Specification, Sok Makara, 2021
  2. Issues in Khmer Syllable Validation, Norbert Lindenberg, 2019
  3. ឯកសារពាក់ព័ន្ធផ្សេងទៀតអំពីយូនីកូដខ្មែរ ដែលលោក Bauhahn បានរៀបចំទុក និងមានលើវេបសាយ KhmerFonts.info

ឯកសារយោង

  1. Unicode 3.0.0, Chapter 9, South and Southeast Asian Script
    ↩︎
  2. Letter to Mr. Maurice Bauhahn in 1996, Khmer Keyboard, ដាញ់ ហុង ↩︎

Posted

in

by

Tags:

Comments

Leave a Reply

Your email address will not be published. Required fields are marked *