UNPKG

stopword

Version:

A module for node.js and the browser that takes in text and returns text that is stripped of stopwords. Has pre-defined stopword lists for 62 languages and also takes lists with custom stopwords as input.

288 lines (286 loc) 3.17 kB
// Copyright (c) 2017 Peter Graham, contributors. Released under the Apache-2.0 license. const ron = [ 'acea', 'aceasta', 'această', 'aceea', 'acei', 'aceia', 'acel', 'acela', 'acele', 'acelea', 'acest', 'acesta', 'aceste', 'acestea', 'aceşti', 'aceştia', 'acolo', 'acord', 'acum', 'ai', 'aia', 'aibă', 'aici', 'al', 'ale', 'alea', 'altceva', 'altcineva', 'am', 'ar', 'are', 'asemenea', 'asta', 'astea', 'astăzi', 'asupra', 'au', 'avea', 'avem', 'aveţi', 'azi', 'aş', 'aşadar', 'aţi', 'bine', 'bucur', 'bună', 'ca', 'care', 'caut', 'ce', 'cel', 'ceva', 'chiar', 'cinci', 'cine', 'cineva', 'contra', 'cu', 'cum', 'cumva', 'curând', 'curînd', 'când', 'cât', 'câte', 'câtva', 'câţi', 'cînd', 'cît', 'cîte', 'cîtva', 'cîţi', 'că', 'căci', 'cărei', 'căror', 'cărui', 'către', 'da', 'dacă', 'dar', 'datorită', 'dată', 'dau', 'de', 'deci', 'deja', 'deoarece', 'departe', 'deşi', 'din', 'dinaintea', 'dintr-', 'dintre', 'doi', 'doilea', 'două', 'drept', 'după', 'dă', 'ea', 'ei', 'el', 'ele', 'eram', 'este', 'eu', 'eşti', 'face', 'fata', 'fi', 'fie', 'fiecare', 'fii', 'fim', 'fiu', 'fiţi', 'frumos', 'fără', 'graţie', 'halbă', 'iar', 'ieri', 'la', 'le', 'li', 'lor', 'lui', 'lângă', 'lîngă', 'mai', 'mea', 'mei', 'mele', 'mereu', 'meu', 'mi', 'mie', 'mine', 'mult', 'multă', 'mulţi', 'mulţumesc', 'mâine', 'mîine', 'mă', 'ne', 'nevoie', 'nici', 'nicăieri', 'nimeni', 'nimeri', 'nimic', 'nişte', 'noastre', 'noastră', 'noi', 'noroc', 'nostru', 'nouă', 'noştri', 'nu', 'opt', 'ori', 'oricare', 'orice', 'oricine', 'oricum', 'oricând', 'oricât', 'oricînd', 'oricît', 'oriunde', 'patra', 'patru', 'patrulea', 'pe', 'pentru', 'peste', 'pic', 'poate', 'pot', 'prea', 'prima', 'primul', 'prin', 'printr-', 'puţin', 'puţina', 'puţină', 'până', 'pînă', 'rog', 'sa', 'sale', 'sau', 'se', 'spate', 'spre', 'sub', 'sunt', 'suntem', 'sunteţi', 'sută', 'sînt', 'sîntem', 'sînteţi', 'să', 'săi', 'său', 'ta', 'tale', 'te', 'timp', 'tine', 'toate', 'toată', 'tot', 'totuşi', 'toţi', 'trei', 'treia', 'treilea', 'tu', 'tăi', 'tău', 'un', 'una', 'unde', 'undeva', 'unei', 'uneia', 'unele', 'uneori', 'unii', 'unor', 'unora', 'unu', 'unui', 'unuia', 'unul', 'vi', 'voastre', 'voastră', 'voi', 'vostru', 'vouă', 'voştri', 'vreme', 'vreo', 'vreun', 'vă', 'zece', 'zero', 'zi', 'zice', 'îi', 'îl', 'îmi', 'împotriva', 'în', 'înainte', 'înaintea', 'încotro', 'încât', 'încît', 'între', 'întrucât', 'întrucît', 'îţi', 'ăla', 'ălea', 'ăsta', 'ăstea', 'ăştia', 'şapte', 'şase', 'şi', 'ştiu', 'ţi', 'ţie' ] export { ron }