cldr
Version:
Library for extracting data from CLDR (the Unicode Common Locale Data Repository)
229 lines (224 loc) • 4.32 kB
text/xml
<!--
Copyright © 1991-2013 Unicode, Inc.
CLDR data files are interpreted according to the LDML specification (http://unicode.org/reports/tr35/)
For terms of use, see http://www.unicode.org/copyright.html
-->
<supplementalData>
<version number="$Revision$"/>
<transforms>
<transform source="Khmr" target="Latn" variant="UNGEGN" direction="forward" draft="provisional" alias="Khmer-Latin/UNGEGN und-Latn-t-und-khmr-m0-ungegn">
<tRule><![CDATA[
########################################################################
# Provisional transcription for Khmer
# https://en.wikipedia.org/wiki/Khmer_script
# https://www.eki.ee/wgrs/rom1_km.pdf
# A complication is due to the classification of consonants as either a-type or o-type
# The rules place the cursor before the inherent vowel
# That is so that the subscript consonants and the vowel modifiers can remove it.
# The rules are sorted first by length (so that there is no "hiding"), then by type of character, then alphabetically
â្ក→k|â ;
â្ខ→kh|â ;
ô្គ→k|ô ;
ô្ឃ→kh|ô ;
ô្ង→ng|ô ;
â្ច→ch|â ;
â្ឆ→chh|â ;
ô្ជ→ch|ô ;
ô្ឈ→chh|ô ;
ô្ញ→nh|ô ;
â្ដ→d|â ;
â្ឋ→th|â ;
ô្ឌ→d|ô ;
ô្ឍ→th|ô ;
â្ណ→n|â ;
â្ត→t|â ;
â្ថ→th|â ;
ô្ទ→t|ô ;
ô្ធ→th|ô ;
ô្ន→n|ô ;
â្ប→b|â ;
â្ផ→ph|â ;
ô្ព→p|ô ;
ô្ភ→ph|ô ;
ô្ម→m|ô ;
ô្យ→y|ô ;
ô្រ→r|ô ;
ô្ល→l|ô ;
ô្វ→v|ô ;
â្ស→s|â ;
â្ហ→h|â ;
â្អ→’|â ;
âុំ→om ;
âាំ→ăm ;
âិះ→ĕh ;
âុះ→ŏh ;
âេះ→éh ;
âោះ→aôh ;
ôុំ→ŭm ;
ôាំ→ŏâm ;
ôិះ→ĭh ;
ôុះ→ŭh ;
ôេះ→éh ;
ôោះ→ŏăh ;
្ក→kâ ;
្ខ→khâ ;
្គ→kô ;
្ឃ→khô ;
្ង→ngô ;
្ច→châ ;
្ឆ→chhâ ;
្ជ→chô ;
្ឈ→chhô ;
្ញ→nhô ;
្ដ→dâ ;
្ឋ→thâ ;
្ឌ→dô ;
្ឍ→thô ;
្ណ→nâ ;
្ត→tâ ;
្ថ→thâ ;
្ទ→tô ;
្ធ→thô ;
្ន→nô ;
្ប→bâ ;
្ផ→phâ ;
្ព→pô ;
្ភ→phô ;
្ម→mô ;
្យ→yô ;
្រ→rô ;
្ល→lô ;
្វ→vô ;
្ស→sâ ;
្ហ→hâ ;
្អ→’â ;
âា→a ;
âិ→ĕ ;
âី→ei ;
âឹ→œ̆ ;
âឺ→œ ;
âុ→ŏ ;
âូ→o ;
âួ→uŏ ;
âើ→aeu ;
âឿ→œă ;
âៀ→iĕ ;
âេ→é ;
âែ→ê ;
âៃ→ai ;
âោ→aô ;
âៅ→au ;
ôា→a ;
ôិ→ĭ ;
ôី→i ;
ôឹ→œ̆ ;
ôឺ→œ ;
ôុ→ŭ ;
ôូ→u ;
ôួ→uŏ ;
ôើ→eu ;
ôឿ→œă ;
ôៀ→iĕ ;
ôេ→é ;
ôែ→ê ;
ôៃ→ey ;
ôោ→oŭ ;
ôៅ→ŏu ;
âំ→âm ;
âះ→ăh ;
ôំ→um ;
ôះ→eăh ;
ក→k|â ;
ខ→kh|â ;
គ→k|ô ;
ឃ→kh|ô ;
ង→ng|ô ;
ច→ch|â ;
ឆ→chh|â ;
ជ→ch|ô ;
ឈ→chh|ô ;
ញ→nh|ô ;
ដ→d|â ;
ឋ→th|â ;
ឌ→d|ô ;
ឍ→th|ô ;
ណ→n|â ;
ត→t|â ;
ថ→th|â ;
ទ→t|ô ;
ធ→th|ô ;
ន→n|ô ;
ប→b|â ;
ផ→ph|â ;
ព→p|ô ;
ភ→ph|ô ;
ម→m|ô ;
យ→y|ô ;
រ→r|ô ;
ល→l|ô ;
វ→v|ô ;
ស→s|â ;
ហ→h|â ;
ឡ→l|â ;
អ→’|â ;
០→0 ;
១→1 ;
២→2 ;
៣→3 ;
៤→4 ;
៥→5 ;
៦→6 ;
៧→7 ;
៨→8 ;
៩→9 ;
ា→a ;
ិ→ĭ ;
ី→i ;
ឹ→œ̆ ;
ឺ→œ ;
ុ→ŭ ;
ូ→u ;
ួ→uŏ ;
ើ→eu ;
ឿ→œă ;
ៀ→iĕ ;
េ→é ;
ែ→ê ;
ៃ→ey ;
ោ→oŭ ;
ៅ→ŏu ;
ំ→m ;
ះ→h ;
ឥ→ĕ ;
ឦ→ei ;
ឧ→ŏ ;
ឨ→ou ;
ឩ→ou ;
ឪ→âu ;
ឫ→rœ̆ ;
ឬ→rœ ;
ឭ→lœ̆ ;
ឮ→lœ ;
ឯ→ê ;
ឰ→ai ;
ឱ→aô ;
ឳ→au ;
ឲ→aô ;
៖→':' ;
ៗ→'&c.' ;
។→'.' ;
ៈ→u’ ;
៉→ ; # TODO switch type
៊→ ; # TODO switch type
់→ ; #TODO
៌→ ; #TODO
៍→ ; #TODO
៏→ ; #TODO
័→ ; #TODO
្→ ; #TODO
]]></tRule>
</transform>
</transforms>
</supplementalData>