stopword
Version:
A module for node.js and the browser that takes in text and returns text that is stripped of stopwords. Has pre-defined stopword lists for 62 languages and also takes lists with custom stopwords as input.
121 lines (119 loc) • 2.12 kB
JavaScript
// Copyright (c) 2017 Peter Graham, contributors. Released under the Apache-2.0 license.
const tha = [
'กล่าว',
'กว่า',
'กัน',
'กับ',
'การ',
'ก็',
'ก่อน',
'ขณะ',
'ขอ',
'ของ',
'ขึ้น',
'คง',
'ครั้ง',
'ความ',
'คือ',
'จะ',
'จัด',
'จาก',
'จึง',
'ช่วง',
'ซึ่ง',
'ดัง',
'ด้วย',
'ด้าน',
'ตั้ง',
'ตั้งแต่',
'ตาม',
'ต่อ',
'ต่าง',
'ต่างๆ',
'ต้อง',
'ถึง',
'ถูก',
'ถ้า',
'ทั้ง',
'ทั้งนี้',
'ทาง',
'ที่',
'ที่สุด',
'ทุก',
'ทํา',
'ทําให้',
'นอกจาก',
'นัก',
'นั้น',
'นี้',
'น่า',
'นํา',
'บาง',
'ผล',
'ผ่าน',
'พบ',
'พร้อม',
'มา',
'มาก',
'มี',
'ยัง',
'รวม',
'ระหว่าง',
'รับ',
'ราย',
'ร่วม',
'ลง',
'วัน',
'ว่า',
'สุด',
'ส่ง',
'ส่วน',
'สําหรับ',
'หนึ่ง',
'หรือ',
'หลัง',
'หลังจาก',
'หลาย',
'หาก',
'อยาก',
'อยู่',
'อย่าง',
'ออก',
'อะไร',
'อาจ',
'อีก',
'เขา',
'เข้า',
'เคย',
'เฉพาะ',
'เช่น',
'เดียว',
'เดียวกัน',
'เนื่องจาก',
'เปิด',
'เปิดเผย',
'เป็น',
'เป็นการ',
'เพราะ',
'เพื่อ',
'เมื่อ',
'เรา',
'เริ่ม',
'เลย',
'เห็น',
'เอง',
'แต่',
'แบบ',
'แรก',
'และ',
'แล้ว',
'แห่ง',
'โดย',
'ใน',
'ให้',
'ได้',
'ไป',
'ไม่',
'ไว้'
]
export { tha }