UNPKG

cldr

Version:

Library for extracting data from CLDR (the Unicode Common Locale Data Repository)

229 lines (224 loc) 4.32 kB
<?xml version="1.0" encoding="UTF-8" ?> <!DOCTYPE supplementalData SYSTEM "../../common/dtd/ldmlSupplemental.dtd"> <!-- Copyright © 1991-2013 Unicode, Inc. CLDR data files are interpreted according to the LDML specification (http://unicode.org/reports/tr35/) For terms of use, see http://www.unicode.org/copyright.html --> <supplementalData> <version number="$Revision$"/> <transforms> <transform source="Khmr" target="Latn" variant="UNGEGN" direction="forward" draft="provisional" alias="Khmer-Latin/UNGEGN und-Latn-t-und-khmr-m0-ungegn"> <tRule><![CDATA[ ######################################################################## # Provisional transcription for Khmer # https://en.wikipedia.org/wiki/Khmer_script # https://www.eki.ee/wgrs/rom1_km.pdf # A complication is due to the classification of consonants as either a-type or o-type # The rules place the cursor before the inherent vowel # That is so that the subscript consonants and the vowel modifiers can remove it. # The rules are sorted first by length (so that there is no "hiding"), then by type of character, then alphabetically â្ក→k|â ; â្ខ→kh|â ; ô្គ→k|ô ; ô្ឃ→kh|ô ; ô្ង→ng|ô ; â្ច→ch|â ; â្ឆ→chh|â ; ô្ជ→ch|ô ; ô្ឈ→chh|ô ; ô្ញ→nh|ô ; â្ដ→d|â ; â្ឋ→th|â ; ô្ឌ→d|ô ; ô្ឍ→th|ô ; â្ណ→n|â ; â្ត→t|â ; â្ថ→th|â ; ô្ទ→t|ô ; ô្ធ→th|ô ; ô្ន→n|ô ; â្ប→b|â ; â្ផ→ph|â ; ô្ព→p|ô ; ô្ភ→ph|ô ; ô្ម→m|ô ; ô្យ→y|ô ; ô្រ→r|ô ; ô្ល→l|ô ; ô្វ→v|ô ; â្ស→s|â ; â្ហ→h|â ; â្អ→’|â ; âុំ→om ; âាំ→ăm ; âិះ→ĕh ; âុះ→ŏh ; âេះ→éh ; âោះ→aôh ; ôុំ→ŭm ; ôាំ→ŏâm ; ôិះ→ĭh ; ôុះ→ŭh ; ôេះ→éh ; ôោះ→ŏăh ; ្ក→kâ ; ្ខ→khâ ; ្គ→kô ; ្ឃ→khô ; ្ង→ngô ; ្ច→châ ; ្ឆ→chhâ ; ្ជ→chô ; ្ឈ→chhô ; ្ញ→nhô ; ្ដ→dâ ; ្ឋ→thâ ; ្ឌ→dô ; ្ឍ→thô ; ្ណ→nâ ; ្ត→tâ ; ្ថ→thâ ; ្ទ→tô ; ្ធ→thô ; ្ន→nô ; ្ប→bâ ; ្ផ→phâ ; ្ព→pô ; ្ភ→phô ; ្ម→mô ; ្យ→yô ; ្រ→rô ; ្ល→lô ; ្វ→vô ; ្ស→sâ ; ្ហ→hâ ; ្អ→’â ; âា→a ; âិ→ĕ ; âី→ei ; âឹ→œ̆ ; âឺ→œ ; âុ→ŏ ; âូ→o ; âួ→uŏ ; âើ→aeu ; âឿ→œă ; âៀ→iĕ ; âេ→é ; âែ→ê ; âៃ→ai ; âោ→aô ; âៅ→au ; ôា→a ; ôិ→ĭ ; ôី→i ; ôឹ→œ̆ ; ôឺ→œ ; ôុ→ŭ ; ôូ→u ; ôួ→uŏ ; ôើ→eu ; ôឿ→œă ; ôៀ→iĕ ; ôេ→é ; ôែ→ê ; ôៃ→ey ; ôោ→oŭ ; ôៅ→ŏu ; âំ→âm ; âះ→ăh ; ôំ→um ; ôះ→eăh ; ក→k|â ; ខ→kh|â ; គ→k|ô ; ឃ→kh|ô ; ង→ng|ô ; ច→ch|â ; ឆ→chh|â ; ជ→ch|ô ; ឈ→chh|ô ; ញ→nh|ô ; ដ→d|â ; ឋ→th|â ; ឌ→d|ô ; ឍ→th|ô ; ណ→n|â ; ត→t|â ; ថ→th|â ; ទ→t|ô ; ធ→th|ô ; ន→n|ô ; ប→b|â ; ផ→ph|â ; ព→p|ô ; ភ→ph|ô ; ម→m|ô ; យ→y|ô ; រ→r|ô ; ល→l|ô ; វ→v|ô ; ស→s|â ; ហ→h|â ; ឡ→l|â ; អ→’|â ; ០→0 ; ១→1 ; ២→2 ; ៣→3 ; ៤→4 ; ៥→5 ; ៦→6 ; ៧→7 ; ៨→8 ; ៩→9 ; ា→a ; ិ→ĭ ; ី→i ; ឹ→œ̆ ; ឺ→œ ; ុ→ŭ ; ូ→u ; ួ→uŏ ; ើ→eu ; ឿ→œă ; ៀ→iĕ ; េ→é ; ែ→ê ; ៃ→ey ; ោ→oŭ ; ៅ→ŏu ; ំ→m ; ះ→h ; ឥ→ĕ ; ឦ→ei ; ឧ→ŏ ; ឨ→ou ; ឩ→ou ; ឪ→âu ; ឫ→rœ̆ ; ឬ→rœ ; ឭ→lœ̆ ; ឮ→lœ ; ឯ→ê ; ឰ→ai ; ឱ→aô ; ឳ→au ; ឲ→aô ; ៖→':' ; ៗ→'&c.' ; ។→'.' ; ៈ→u’ ; ៉→ ; # TODO switch type ៊→ ; # TODO switch type ់→ ; #TODO ៌→ ; #TODO ៍→ ; #TODO ៏→ ; #TODO ័→ ; #TODO ្→ ; #TODO ]]></tRule> </transform> </transforms> </supplementalData>