stopword
Version:
A module for node.js and the browser that takes in text and returns text that is stripped of stopwords. Has pre-defined stopword lists for 62 languages and also takes lists with custom stopwords as input.
116 lines (114 loc) • 1.13 kB
JavaScript
// Copyright (c) 2017 Peter Graham, contributors. Released under the Apache-2.0 license.
const slk = [
'a',
'aby',
'aj',
'ako',
'aký',
'ale',
'alebo',
'ani',
'avšak',
'ba',
'bez',
'buï',
'cez',
'do',
'ho',
'hoci',
'i',
'ich',
'im',
'ja',
'jeho',
'jej',
'jemu',
'ju',
'k',
'kam',
'kde',
'kedže',
'keï',
'kto',
'ktorý',
'ku',
'lebo',
'ma',
'mi',
'mne',
'mnou',
'mu',
'my',
'mòa',
'môj',
'na',
'nad',
'nami',
'neho',
'nej',
'nemu',
'nich',
'nielen',
'nim',
'no',
'nám',
'nás',
'náš',
'ním',
'o',
'od',
'on',
'ona',
'oni',
'ono',
'ony',
'po',
'pod',
'pre',
'pred',
'pri',
's',
'sa',
'seba',
'sem',
'so',
'svoj',
'taký',
'tam',
'teba',
'tebe',
'tebou',
'tej',
'ten',
'ti',
'tie',
'to',
'toho',
'tomu',
'tou',
'tvoj',
'ty',
'tá',
'tým',
'v',
'vami',
'veï',
'vo',
'vy',
'vám',
'vás',
'váš',
'však',
'z',
'za',
'zo',
'a',
'èi',
'èo',
'èí',
'òom',
'òou',
'òu',
'že'
]
export { slk }