stopword
Version:
A module for node.js and the browser that takes in text and returns text that is stripped of stopwords. Has pre-defined stopword lists for 62 languages and also takes lists with custom stopwords as input.
104 lines (102 loc) • 1.19 kB
JavaScript
// Copyright (c) 2017 Peter Graham, contributors. Released under the Apache-2.0 license.
const eus = [
'al',
'anitz',
'arabera',
'asko',
'baina',
'bat',
'batean',
'batek',
'bati',
'batzuei',
'batzuek',
'batzuetan',
'batzuk',
'bera',
'beraiek',
'berau',
'berauek',
'bere',
'berori',
'beroriek',
'beste',
'bezala',
'da',
'dago',
'dira',
'ditu',
'du',
'dute',
'edo',
'egin',
'ere',
'eta',
'eurak',
'ez',
'gainera',
'gu',
'gutxi',
'guzti',
'haiei',
'haiek',
'haietan',
'hainbeste',
'hala',
'han',
'handik',
'hango',
'hara',
'hari',
'hark',
'hartan',
'hau',
'hauei',
'hauek',
'hauetan',
'hemen',
'hemendik',
'hemengo',
'hi',
'hona',
'honek',
'honela',
'honetan',
'honi',
'hor',
'hori',
'horiei',
'horiek',
'horietan',
'horko',
'horra',
'horrek',
'horrela',
'horretan',
'horri',
'hortik',
'hura',
'izan',
'ni',
'noiz',
'nola',
'non',
'nondik',
'nongo',
'nor',
'nora',
'ze',
'zein',
'zen',
'zenbait',
'zenbat',
'zer',
'zergatik',
'ziren',
'zituen',
'zu',
'zuek',
'zuen',
'zuten'
]
export { eus }