UNPKG

stopword

Version:

A module for node.js and the browser that takes in text and returns text that is stripped of stopwords. Has pre-defined stopword lists for 62 languages and also takes lists with custom stopwords as input.

224 lines (222 loc) 2.43 kB
// Copyright (c) 2017 Peter Graham, contributors. Released under the Apache-2.0 license. const cat = [ 'a', 'abans', 'ací', 'ah', 'així', 'això', 'al', 'aleshores', 'algun', 'alguna', 'algunes', 'alguns', 'alhora', 'allà', 'allí', 'allò', 'als', 'altra', 'altre', 'altres', 'amb', 'ambdues', 'ambdós', 'apa', 'aquell', 'aquella', 'aquelles', 'aquells', 'aquest', 'aquesta', 'aquestes', 'aquests', 'aquí', 'baix', 'cada', 'cadascuna', 'cadascunes', 'cadascuns', 'cadascú', 'com', 'contra', 'd\'un', 'd\'una', 'd\'unes', 'd\'uns', 'dalt', 'de', 'del', 'dels', 'des', 'després', 'dins', 'dintre', 'donat', 'doncs', 'durant', 'e', 'eh', 'el', 'els', 'em', 'en', 'encara', 'ens', 'entre', 'eren', 'es', 'esta', 'estaven', 'esteu', 'està', 'estàvem', 'estàveu', 'et', 'etc', 'ets', 'fins', 'fora', 'gairebé', 'ha', 'han', 'has', 'havia', 'he', 'hem', 'heu', 'hi', 'ho', 'i', 'igual', 'iguals', 'ja', 'l\'hi', 'la', 'les', 'li', 'li\'n', 'llavors', 'm\'he', 'ma', 'mal', 'malgrat', 'mateix', 'mateixa', 'mateixes', 'mateixos', 'me', 'mentre', 'meu', 'meus', 'meva', 'meves', 'molt', 'molta', 'moltes', 'molts', 'mon', 'mons', 'més', 'n\'he', 'n\'hi', 'ne', 'ni', 'no', 'nogensmenys', 'només', 'nosaltres', 'nostra', 'nostre', 'nostres', 'o', 'oh', 'oi', 'on', 'pas', 'pel', 'pels', 'per', 'perquè', 'però', 'poc', 'poca', 'pocs', 'poques', 'potser', 'propi', 'qual', 'quals', 'quan', 'quant', 'que', 'quelcom', 'qui', 'quin', 'quina', 'quines', 'quins', 'què', 's\'ha', 's\'han', 'sa', 'semblant', 'semblants', 'ses', 'seu', 'seus', 'seva', 'seves', 'si', 'sobre', 'sobretot', 'solament', 'sols', 'son', 'sons', 'sota', 'sou', 'sóc', 'són', 't\'ha', 't\'han', 't\'he', 'ta', 'tal', 'també', 'tampoc', 'tan', 'tant', 'tanta', 'tantes', 'teu', 'teus', 'teva', 'teves', 'ton', 'tons', 'tot', 'tota', 'totes', 'tots', 'un', 'una', 'unes', 'uns', 'us', 'va', 'vaig', 'vam', 'van', 'vas', 'veu', 'vosaltres', 'vostra', 'vostre', 'vostres', 'érem', 'éreu', 'és' ] export { cat }