stopword
Version:
A module for node.js and the browser that takes in text and returns text that is stripped of stopwords. Has pre-defined stopword lists for 62 languages and also takes lists with custom stopwords as input.
115 lines (113 loc) • 1.22 kB
JavaScript
// Copyright (c) 2017 Peter Graham, contributors. Released under the Apache-2.0 license.
const gle = [
'a',
'ach',
'ag',
'agus',
'an',
'aon',
'ar',
'arna',
'as',
'b\'',
'ba',
'beirt',
'bhúr',
'caoga',
'ceathair',
'ceathrar',
'chomh',
'chtó',
'chuig',
'chun',
'cois',
'céad',
'cúig',
'cúigear',
'd\'',
'daichead',
'dar',
'de',
'deich',
'deichniúr',
'den',
'dhá',
'do',
'don',
'dtí',
'dá',
'dár',
'dó',
'faoi',
'faoin',
'faoina',
'faoinár',
'fara',
'fiche',
'gach',
'gan',
'go',
'gur',
'haon',
'hocht',
'i',
'iad',
'idir',
'in',
'ina',
'ins',
'inár',
'is',
'le',
'leis',
'lena',
'lenár',
'm\'',
'mar',
'mo',
'mé',
'na',
'nach',
'naoi',
'naonúr',
'ná',
'ní',
'níor',
'nó',
'nócha',
'ocht',
'ochtar',
'os',
'roimh',
'sa',
'seacht',
'seachtar',
'seachtó',
'seasca',
'seisear',
'siad',
'sibh',
'sinn',
'sna',
'sé',
'sí',
'tar',
'thar',
'thú',
'triúr',
'trí',
'trína',
'trínár',
'tríocha',
'tú',
'um',
'ár',
'é',
'éis',
'í',
'ó',
'ón',
'óna',
'ónár'
]
export { gle }