sentencex
Version:
Sentence segmentation library
107 lines (102 loc) • 1.26 kB
JavaScript
import BaseLanguage from '../base.js'
const romanNumerals = 'i ii iii iv v vi vii viii ix x xi xii xiii xiv x xi xii xiii xv xvi xvii xviii xix xx'
const romanNumeralsSet = new Set([...romanNumerals.split(' '), ...romanNumerals.toUpperCase().split(' ')])
const abbreviations = new Set([
...romanNumeralsSet,
'Adj',
'Adm',
'Adv',
'Art',
'Ca',
'Capt',
'Cmdr',
'Col',
'Comdr',
'Con',
'Corp',
'Cpl',
'DR',
'DRA',
'Dr',
'Dra',
'Dras',
'Drs',
'Eng',
'Enga',
'Engas',
'Engos',
'Ex',
'Exo',
'Exmo',
'Fig',
'Gen',
'Hosp',
'Insp',
'Lda',
'MM',
'MR',
'MRS',
'MS',
'Maj',
'Mrs',
'Ms',
'Msgr',
'Op',
'Ord',
'Pfc',
'Ph',
'Prof',
'Pvt',
'Rep',
'Reps',
'Res',
'Rev',
'Rt',
'Sen',
'Sens',
'Sfc',
'Sgt',
'Sr',
'Sra',
'Sras',
'Srs',
'Sto',
'Supt',
'Surg',
'adj',
'adm',
'adv',
'art',
'cit',
'col',
'con',
'corp',
'cpl',
'dr',
'dra',
'dras',
'drs',
'eng',
'enga',
'engas',
'engos',
'ex',
'exo',
'exmo',
'fig',
'op',
'prof',
'sr',
'sra',
'sras',
'srs',
'sto',
'v',
'vs',
'i.e',
'rev',
'e.g'
])
export default class Portuguese extends BaseLanguage {
static abbreviations = abbreviations
}