UNPKG

stopword

Version:

A module for node.js and the browser that takes in text and returns text that is stripped of stopwords. Has pre-defined stopword lists for 62 languages and also takes lists with custom stopwords as input.

115 lines (113 loc) 1.22 kB
// Copyright (c) 2017 Peter Graham, contributors. Released under the Apache-2.0 license. const gle = [ 'a', 'ach', 'ag', 'agus', 'an', 'aon', 'ar', 'arna', 'as', 'b\'', 'ba', 'beirt', 'bhúr', 'caoga', 'ceathair', 'ceathrar', 'chomh', 'chtó', 'chuig', 'chun', 'cois', 'céad', 'cúig', 'cúigear', 'd\'', 'daichead', 'dar', 'de', 'deich', 'deichniúr', 'den', 'dhá', 'do', 'don', 'dtí', '', 'dár', '', 'faoi', 'faoin', 'faoina', 'faoinár', 'fara', 'fiche', 'gach', 'gan', 'go', 'gur', 'haon', 'hocht', 'i', 'iad', 'idir', 'in', 'ina', 'ins', 'inár', 'is', 'le', 'leis', 'lena', 'lenár', 'm\'', 'mar', 'mo', '', 'na', 'nach', 'naoi', 'naonúr', '', '', 'níor', '', 'nócha', 'ocht', 'ochtar', 'os', 'roimh', 'sa', 'seacht', 'seachtar', 'seachtó', 'seasca', 'seisear', 'siad', 'sibh', 'sinn', 'sna', '', '', 'tar', 'thar', 'thú', 'triúr', 'trí', 'trína', 'trínár', 'tríocha', '', 'um', 'ár', 'é', 'éis', 'í', 'ó', 'ón', 'óna', 'ónár' ] export { gle }