UNPKG

@aladas-org/cryptocalc

Version:
208 lines (189 loc) 44 kB
//======================================================================================= //================================ HI_build_wordlist.js ============================= //======================================================================================= "use strict"; const fs = require('node:fs'); let HINDI_ORIGINAL_WORDLIST = ["अंकुड़ा","अंगूठी","अंग्रेजों","अंडा","अंततः","अंतर्गत","अंतिम","अंदर","अंदाज","अंधा","अंधेरा","अकादमी","अकेला","अक्टूबर","अक्षरशः","अक्सर","अखाड़ा","अगला","अगले","अगस्त","अग्रिम", "अचानक","अच्छा","अजगर","अजनबी","अजीब","अज्ञात","अटपटा","अतिथि","अतिरिक्त","अत्यंत","अदालती","अदृश्य","अद्भुत","अधिक","अधिग्रहण","अधिमूल्य","अध्यक्ष","अनंत","अनगिनत", "अनजान","अनन्य","अनाज","अनाम","अनावरण","अनिच्छुक","अनिश्चितता","अनुक्रमणिका","अनुच्छेद","अनुदेश","अनुप्रयोग","अनुबंध","अनुभव","अनुमति","अनुवाद","अनुशासन","अनुसंधान","अनोखा", "अनौपचारिक","अन्तर","अन्य","अन्वेषक","अपना","अपराध","अपरिवर्तनवादी","अपवाद","अपेक्षाकृत","अप्रैल","अफवाह","अफ़सर","अफ़्रीकी","अभिनेता","अभिप्राय","अभिभावक","अभियान","अभिलेख", "अभिव्यक्ति","अभूतपूर्व","अभ्यास","अमेरिकन","अम्ल","अर्थ","अर्हता","अलविदा","अलार्म","अल्पसंख्यक","अल्फा","अवगत","अवतरण","अवधि","अवयव","अवयस्क","अवलोकन","अवसर","अविश्वसनीय", "अवैध","अव्यवस्था","अशिष्ट","असंभव","असत्य","असफलता","असमर्थ","असली","असहमत","असाइन","असाधारण","असामान्य","असुविधाजनक","असैनिक","अस्तित्व","अस्थायी","अस्पताल","अस्वीकार", "अहंकार","अहां","आँसू","आंकड़े","आंधी","आंशिक","आइकन","आईना","आउटर","आउटलेट","आकर्षित","आकलन","आकार","आकाश","आकृति","आक्रमण","आखिरकार","आगंतुक","आगमन", "आगामी","आघात","आचरण","आज़ादी","आजादी","आजीविका","आठवाँ","आतंकवादी","आतुर","आत्मा","आदमी","आदर्श","आदेश","आधार","आधुनिक","आध्यात्मिक","आनंद","आपका","आपत्ति", "आपदा","आपराधिक","आपसी","आपातकालीन","आपूर्ति","आप्रवासी","आबादी","आभारी","आभासी","आभूषण","आमंत्रण","आयतन","आयरिश","आयात","आयाम","आयुक्त","आयोग","आरक्षण", "आरामदायक","आरोप","आर्थिक","आलसी","आलिंगन","आलोचना","आवरण","आवश्यक","आवाज़","आवास","आविष्कार","आवृत्ति","आवेदन","आशावादी","आश्चर्य","आश्रय","आश्वासन","आसान", "आस्तीन","आस्था","आहार","इंजीनियर","इंटरनेट","इंतजार","इंतिहान","इंसानियत","इंस्टॉल","इकट्ठा","इकाई","इक्विटी","इच्छा","इजरायल","इतालवी","इतिवृत्त","इतिहास","इनकार","इनपुट","इनहेरिट", "इनाम","इन्वेस्टर","इमारत","इराक","इरादा","इलाज","इलेक्ट्रोनिक","इसका","इसलाम","इसलिए","इस्पात","इस्लामी","ईंधन","ईमानदार","ईमेल","ईरानी","ईर्ष्या","ईसाई","उंगली","उचक्का","उचित", "उच्च","उछाल","उजागर","उठता","उठाना","उड़ना","उड़ान","उतरना","उत्कृष्ट","उत्तीर्ण","उत्पाद","उत्सर्जन","उथला","उदारवादी","उदास","उदाहरण","उद्देश्य","उद्धार","उद्योग","उधार","उधेड़ना", "उनका","उनके","उन्नत","उन्हें","उपकरण","उपग्रह","उपदेशक","उपनगर","उपनाम","उपन्यास","उपभोक्ता","उपयुक्त","उपयोग","उपलब्ध","उपस्थिति","उपहार","उपाध्यक्ष","उपाय","उभरते","उभरना", "उमंग","उम्मीदवार","उम्र","उलझन","उलटना","उल्लेख","उष्णकटिबंधीय","उसकी","उसके","ऊर्जा","एंड्रॉयड","एकड़","एकता","एकमात्र","एकांत","एकाग्रता","एकीकृत","एक्साइट","एजेंसी","एड़ी","एड्स", "एथलीट","एमएमएम","एयरलाइन","एल्बम","एशियाई","एहसास","ऐतिहासिक","ऑक्सीजन","ऑनलाइन","ऑपरेटर","ओपेरा","ओलम्पिक","ओलिंपिक","ओवरलुक","औद्योगिक","औपचारिक","औपनिवेशिक", "और/या","कंधा","कंपनी","कंबल","कंसर्ट","कक्ष","कचरा","कच्चा","कछुए","कटोरा","कठिन","कठोर","कड़वा","कड़ाही","कथावाचक","कथित","कनिष्ठ","कपड़े","कपास","कप्तान","कब्जा","कमज़ोर", "कमजोर","कमबख्त","कमांडर","कमाना","कमीज","कम्युनिस्ट","करदाता","करना","करेगा","कर्ज","कर्तव्य","कर्नल","कर्मचारी","कलाई","कलाकार","कलात्मक","कलेक्ट","कल्पना","कल्याण","कवरेज", "कविता","कष्ट","कहानी","कहीं","क़ानून","कांग्रेस","कांच","कांटा","कांड","काउंटी","कागज़","काटना","कानून","काफी","काबिल","कामुक","कायल","कारण","कारागार","कार्यक्रम","काला","कालोनी", "काष्ठफल","किंडा","किताब","किनारा","किरण","किराये","किला","किशोर","किसका","किसान","किस्मत","कीचड़","कीड़ा","कीबोर्ड","कीमत","कुंडली","कुकी","कुड़ाकुड़ाना","कुतिया","कुत्ता","कुमारी", "कुरूप","कुर्सी","कुशल","कूटनीतिक","कूल्हा","कृत्रिम","कृपया","कृपादृष्टि","कृषि","केंद्र","केबल","केबिन","केला","केवल","कैंडी","कैंपस","कैंसर","कैथोलिक","कैदी","कैनवास","कैनेडियन","कैफ़े", "कैमरा","कैलोरी","कैसीनो","कैसे","कॉपीराइट","कॉफ़ी","कॉमेडी","कॉलर","कोठरी","कोड़ा","कोने","कोयला","कोरियाई","कोर्ट","कोलेस्ट्रॉल","कोस्ट","कोहनी","कौशल","क्या","क्यों","क्रमश","क्रांति", "क्रिसमस","क्रीक","क्रूज","क्रेता","क्रोध","क्लब","क्लासिक","क्लिक","क्लीनिकल","क्वार्टरबैक","क्षति","क्षमता","क्षितिज","क्षेत्र","खंभा","खजाना","खड़ी","खतरनाक","खतरा","खरगोश","खराब","खरीदना", "खरोंच","खर्च","ख़ज़ाना","ख़ुशी","खाड़ी","खातिर","खाना","खारिज","खाली","खिड़की","खिलाड़ी","खिलौने","खींचना","खुदरा","खुरदुरा","खुराक","खुलासा","खोना","खोपड़ी","गंतव्य","गंदगी","गंदा","गंभीर", "गठबंधन","गड़बड़","गड्ढा","गणतंत्र","गणित","गतिकी","गतिविधि","गतिशील","गरीब","गर्दन","गर्भपात","गर्मी","गर्व","गलती","गलियारे","गलीचा","गवाही","गहरा","ग़ैर-लाभकारी","गाँव","गाड़","गाना", "गायक","गायब","गारंटी","गिटार","गिद्ध","गिनती","गियर","गिरना","गिरोह","गीला","गुज़रना","गुड़िया","गुणवत्ता","गुप्त","गुफा","गुब्बारा","गुरुजी","गुरूवार","गुलाम","गुलोबन्द","गुस्सा","गूंगा","गूंज", "गृहस्थी","गेंद","गेराज","गेलरी","गेहूं","गैलन","गोपनीयता","गोपी","गोरा","गोली","गोल्फ़","गौमांस","गौरव","ग्यारह","ग्रह","ग्राहक","ग्रिड","ग्रेड","ग्लोब","घंटा","घंटी","घटना","घटाना","घड़ी","घनत्व", "घबराहट","घरेलू","घाटा","घाटी","घातक","घायल","घिसाव","घुटना","घुमाव","घूमना","घृणा","घोंसला","घोड़ा","घोषणा","घोषित","चंद्रमा","चक्की","चक्र","चटकाना","चटनी","चट्टान","चढना","चढ़ाई", "चतुर","चबाने","चमकदार","चमड़ा","चमत्कार","चरवाहे","चरित्र","चर्च","चलचित्र","चलाना","चांदी","चाकू","चाचा","चाची","चादर","चाभी","चारा","चार्ज","चालक","चालीस","चावल","चाहना","चाहिए", "चाहेंगे","चिंता","चिकित्सक","चिड़िया","चित्र","चिल्लाहट","चीज़","चीनी","चुनना","चुनाव","चुनें","चुनौती","चुपचाप","चुम्मा","चुराना","चूंकि","चूसना","चूहा","चेतना","चेतावनी","चेहरा","चैंपियनशिप", "चैनल","चॉकलेट","चोटी","चौड़ा","चौथी","छड़ी","छलांग","छाती","छात्र","छाया","छिपाना","छुट्टी","छोटा","छोड़ना","जंगल","जंजीर","जंतु","जटिल","जनगणना","जनजाति","जनतंत्र","जनता","जनवरी", "जनसांख्यिकीय","जन्म","जबकि","जबड़ा","जबसे","जयकार","जरूर","जर्मन","जलयात्रा","जलवायु","जलाना","जवाब","जश्न","ज़बर्दस्त","ज़मीन","ज़रूरत","ज़ाहिर","ज़िम्मेदारी","ज़ोर","जाँच","जांघ", "जांच","जागना","जागरूकता","जाति","जातीय","जादू","जानकारी","जानना","जानम","जानवर","जापानी","जायदाद","जारी","जासूसी","जिंदगी","जिगर","जिज्ञासु","जिला","जीन्स","जीवनसाथी","जीवविज्ञान", "जीवाणु","जीवित","जुड़वां","जुडिये","जुबान","जुलाई","जुलूस","जूता","जेनेटिक","जैकेट","जैतून","जैविक","जैसा","जोखिम","जोड़ें","जोशीला","ज्ञान","ज्येष्ठ","ज्योति","ज्वार","झंडा","झटका","झटपट", "झुंड","झुकना","झूठा","झूला","टकराव","टखने","टचडाउन","टमाटर","टांगना","टाइटिल","टायर","टालना","टास्क","टिकट","टिकाऊ","टिप्पणी","टीका","टीममाइट","टीवी","टुकड़ा","टूर्नामेंट","टेनिस", "टेबल","टेलीविजन","टैंक","टोकरी","टोपी","ट्यूब","ट्रक","ट्रेंड","ट्विटर","ठंडा","ठहराव","ठानना","ठेकेदार","ठोकर","ठोड़ी","डराना","डरावनी","डाउनलोड","डाक्यूमेंट","डायन","डायरी","डालने","डाली", "डिग्री","डिजाईन","डिजिटल","डिप्रेशन","डिब्बा","डिस्कवर","डीएनए","डेटाबेस","डेवलपर","डेस्क","डॉलर","डोरी","ड्रम","ड्राइविंग","ड्रिल","ढहने","ढांचा","ढालना","ढीला","ढोना","तंत्र","तंबाकू","तंबू", "तकती","तकनीक","तकिया","तटस्थ","तटीय","तत्त्व","तत्पर","तथाकथित","तथ्य","तनाव","तराना","तरीका","तर्क","तलवार","तलाक","तलाशी","तस्वीर","तहखाने","ताकत","ताज़ा","तापमान","तार्किक", "तालाब","तीखा","तीव्र","तीसरा","तुरंत","तुर्की","तुलना","तूफान","तेजस्वी","तेज़","तैनाती","तैयार","तैराकी","तोड़ना","तौलना","तौलिया","त्यौहार","त्रासदी","त्रिमास","त्रुटि","त्वचा","थप्पड़","थाली", "थिएटर","थैला","थोड़ा","थोपना","दंगा","दंतकथा","दक्षिण","दबाएँ","दबाव","दराज","दरार","दरिंदा","दर्जन","दर्द","दर्शक","दलील","दवाई","दस्तक","दांत","दाता","दादा","दादी","दानव","दायरा", "दार्शनिक","दालान","दावा","दिखावट","दिनचर्या","दिनांक","दिमाग","दिलचस्प","दिवालियापन","दिव्य","दिशा","दिसंबर","दीपक","दीर्घावधि","दीवार","दुकान","दुखद","दुखी","दुनिया","दुबला","दुर्घटना", "दुल्हन","दुश्मन","दूतावास","दूरबीन","दूरस्थ","दूरी","दूसरा","दृढ़","दृश्य","दृष्टि","देखना","देखभाल","देखरेख","देखो","देना","देयता","देवदूत","दैनिक","दोनों","दोपहर","दोषसिद्धि","दोषी","दोस्त", "दोहराना","दौड़ना","दौरान","द्रव्यमान","द्वारा","द्वीप","धकेलना","धक्का","धड़कन","धन्यवाद","धमकाना","धमकी","धमाके","धरती","धर्म","धागा","धातु","धारणा","धारा","धारी","धार्मिक","धीरे","धुआं", "धुलाई","धूसर","धैर्य","धोखा","धोखेबाज़","धोबीघर","ध्यान","ध्वनि","नंगा","नकारात्मक","नक्शा","नतीजा","नमस्ते","नमूना","नर्तकी","नर्स","नवंबर","नवाचार","नश्वरता","नहीं","नाखून","नागरिक", "नाज़ुक","नाटकीय","नाभिकीय","नामजद","नामांकन","नायक","नाली","नासमझ","निकालना","निगमित","निगरानी","निगलना","निगाहें","निचोड़","निजी","नितंब","निदान","निधि","निबंध","निमंत्रण", "नियंत्रण","नियम","नियामक","नियोक्ता","निरंतर","निरसित","निराशा","निरीक्षक","निर्माण","निलंबित","निवासी","निविदा","निवृत्ति","निवेश","निशान","निषेध","निष्पक्ष","निहितार्थ","नींद","नींबू","नींव", "नीचे","नीति","नीला","नृत्य","नेटवर्क","नेता","नेतृत्व","नैतिक","नौकर","नौसेना","न्याय","न्यूनतम","पंक्ति","पंचायत","पंजीकरण","पंडित","पंद्रह","पकड़","पक्ष","पचास","पट्टी","पड़ोसी","पढ़ना", "पढाई","पतला","पतीला","पत्ता","पत्थर","पत्नी","पत्र","पदार्थ","पदोन्नति","पनीर","परंपरागत","परदा","परमिट","परमेश्वर","पराक्रम","परामर्श","परास्त","परिक्षण","परिचित","परिणाम","परिदृश्य", "परिप्रेक्ष्य","परिभाषा","परियोजना","परिवार","परिषद","परिस्थिति","परीक्षण","परेड","परेशानी","पर्ची","पर्याप्त","पर्वत","पर्स","पलायन","पवित्र","पश्चिम","पसंद","पसीना","पहचानना","पहनावा","पहरा", "पहलू","पहले","पहाड़ी","पहिया","पहुंच","पहेली","पांचवां","पाइप","पाउडर","पागल","पाठयपुस्तक","पाठ्यक्रम","पात्र","पादरी","पाना","पानी","पापा","पायलट","पारंपरिक","पारगमन","पार्क","पिंजरा", "पिघल","पिछवाड़े","पिज़्ज़ा","पिता","पियानो","पिशाच","पीछे","पीढ़ी","पीना","पीने","पीला","पीसी","पुजारी","पुनः","पुनर्निर्वाचन","पुरस्कार","पुराना","पुरुष","पुलिस","पुष्ट","पुस्तकालय","पूंछ", "पूंजीवाद","पूछना","पूर्व","पृथक्करण","पृष्ठ","पेंशन","पेटेंट","पेट्रोल","पेड़","पेशा","पेशेवर","पैकेज","पैतृक","पैनल","पैरामीटर","पैसे","पोंछना","पोशाक","पोषक","पोषण","पोस्टर","पौंड", "पौधा","प्यार","प्रक्रिया","प्रगति","प्रजातंत्रवादी","प्रणाली","प्रति","प्रथम","प्रदर्शन","प्रधान","प्रपत्र","प्रबंध","प्रभात","प्रमुख","प्रयास","प्रलय","प्रवर्तन","प्रश्न","प्रस्ताव","प्राप्त","प्रिंट","प्रेमिका", "प्रोफ़ेसर","प्रौद्योगिकी","प्लस","प्लास्टिक","प्लेट","फर्नीचर","फलना","फलस्वरूप","फ़रवरी","फ़ाइल","फ़िल्म","फ़ुटबॉल","फ़ैक्टर","फ़ोन","फाड़ना","फायदा","फिलिस्तीनी","फिल्टर","फीका", "फीता","फुटबॉल","फुटेज","फुसफुसाना","फेंकना","फेफड़ा","फैलाना","फोजी","फोटो","फोड़ना","फोडा","फ्रीज","फ्रेंच","फ्लिप","फ्लैट","बंदरगाह","बंदी","बंदूक","बंधक","बंधन","बकरी", "बकवास","बकाया","बक्शीश","बगीचा","बचपन","बचाव","बच्चा","बजाय","बड़ा","बढ़त","बढ़ना","बढ़ावा","बढ़िया","बढ़ोतरी","बताना","बत्तख","बदलने","बदला","बनना","बनाना","बनाम", "बनावट","बयान","बरामदा","बर्गर","बर्फ","बर्बाद","बलात्कार","बलूत","बल्कि","बल्ला","बहना","बहरहाल","बहादुर","बहाल","बहुत","बहुमत","बाँध","बाइबिल","बाएं","बागी","बाड़","बाढ़", "बातचीत","बादल","बाधा","बारंबार","बारह","बाल्टी","बावर्ची","बास्केटबाल","बाहर","बिंदु","बिक्री","बिखराव","बिजली","बिताना","बिना","बिल्कुल","बिशप","बिस्तर","बीओओटी","बीमा","बीयर", "बुखार","बुज़ुर्ग","बुद्धि","बुधवार","बुनियादी","बुराई","बुलबुला","बुलाना","बूंद","बेंच","बेकरार","बेकार","बेघर","बेचना","बेचैन","बेटा","बेटी","बेड़ा","बेरोजगारी","बेल्ट","बेवकूफ","बेसबॉल", "बेहतर","बैंक","बैंड","बैकअप","बैटरी","बैठक","बैठना","बैरल","बैरियर","बॉर्डर","बॉलीवुड","बोतल","बोरिंग","बोलना","बोली","बौछार","बौद्धिक","ब्यूरो","ब्रम्हांड","ब्रश","ब्रांड","ब्लीड","ब्लेड", "ब्लॉग","भंडारण","भगवान","भण्डार","भयंकर","भयानक","भरना","भलाई","भविष्य","भव्य","भागना","भागीदारी","भाग्यशाली","भारतीय","भारी","भालू","भावना","भावुक","भाषण","भिन्न","भीड़", "भीतरी","भुगतना","भूकंप","भूखंड","भूखा","भूतकाल","भूतपूर्व","भूमिका","भूरा","भेजना","भेड़िया","भेदभाव","भोजन","भ्रमित","भ्रष्टाचार","मंगलवार","मंज़िल","मंजूर","मंडल","मंडी","मंत्री","मंदिर", "मंदी","मंशा","मकान","मक्का","मक्खन","मछली","मजबूत","मज़दूर","मज़ा","मज़ेदार","मटका","मटकी","मतदाता","मतलब","मताधिकार","मधुमेह","मध्यम","मनवाना","मनोदशा","मनोरंजन", "मनोवैज्ञानिक","मरना","मरम्मत","मरीज","मर्जी","मलाई","मशीन","महंगा","महत्त्व","महाद्वीप","महान","महापौर","महाविद्यालय","महासागर","महिला","महीना","महोदय","मांगना","मांस","माता-पिता", "मातृभूमि","मात्र","माथा","माध्यमिक","मानक","मानदंड","मानव","मानसिक","माना","मान्यता","मामला","मामूली","मारना","मारिजुआना","मारो","मार्ग","मालिक","मासूम","मिक्स","मिट्टी","मिठाई", "मित्र","मिनट","मिमी-हम्म","मिर्च","मिलना","मिलान","मिशन","मिश्रण","मिसाइल","मीटर","मीडिया","मीनार","मुंह","मुकदमा","मुकाबला","मुखर","मुखौटा","मुख्य","मुझे","मुट्ठी","मुठभेड़", "मुद्दा","मुमकिन","मुरझाना","मुर्गा","मुलाकात","मुसलमान","मुसीबत","मुस्कुराओ","मुहर","मूंगफली","मूलपाठ","मूल्य","मृत्यु","मेकअप","मेज़बान","मेडिकल","मेन्यू","मेरा","मेरे","मेहरबान", "मैकेनिक","मैक्सिकन","मैजिकल","मैदान","मैयत","मॉनिटर","मोका","मोटर","मोटा","मोड़","मोबाइल","मोमबत्ती","मोहल्ला","मौका","मौखिक","मौज़ा","मौजूद","मौलिक","मौसम","यंत्र","यकीनन", "यथोचित","यद्यपि","यन्त्र","यहां","यहूदी","यांत्रिक","याचिका","यातायात","यात्रा","यार्ड","युक्ति","युद्ध","युवा","यूनानी","यूपी","यूरोपीय","योगदान","योग्यता","योजना","योद्धा","रंगरूट","रक्त", "रक्षा","रखना","रखरखाव","रगड़","रचनात्मक","रणनीति","रविवार","रवैया","रसोइया","रसोईघर","रस्सी","रहना","रहस्य","राइफल","राकेट","राक्षस","राजकुमार","राजधानी","राजनीतिक","राजस्व", "राजा","राज्य","राडार","रानी","राष्ट्रीय","रासायनिक","रास्ता","राहत","रिकॉर्डिंग","रिक्त","रिज़र्व","रिटायर","रिपब्लिकन","रिपोर्टर","रिश्तेदार","रिसाव","रिसीवर","रिहाई","रीडर","रीति","रुकना", "रुको","रुखा","रुचि","रूपक","रूपरेखा","रूपवान","रूसी","रेंगना","रेखा","रेगिस्तान","रेटिंग","रेडियो","रेशम","रेशा","रेस्टोरेंट","रैली","रोकना","रोज़गार","रोटी","रोना","रोबोट","रोमन","रोमांस", "रोलिंग","रोशनी","लंगर","लंबा","लकड़ी","लक्ष्य","लगना","लगभग","लगातार","लचीला","लड़की","लड़ाई","लपकना","लहज़ा","लहसुन","लाइव","लाइसेंस","लागत","लागू","लापता","लायक","लिंग", "लिखना","लिखें","लिखो","लिपि","लिफ़्ट","लूटना","लेंस","लेकिन","लेखक","लेखांकन","लेज़र","लेना","लेफ्टिनेंट","लेबल","लैटिन","लैपटॉप","लॉकर","लॉबी","लोकतांत्रिक","लोकप्रिय","लोहा","वकील", "वक्ता","वक्र","वन्यजीव","वयस्क","वरिष्ठ","वरीयता","वर्ग","वर्णन","वर्तमान","वर्दी","वर्ष","वसंत","वस्तु","वहां","वाइन","वाइरस","वाक्य","वातावरण","वापसी","वायदा","वायर","वायु","वारंट", "वार्षिक","वास्तविक","वाहक","वाहन","विंग","विकल्प","विकास","विकिरण","विक्रेता","विचलन","विचार","विचित्र","विजय","विजेता","विज्ञान","विटामिन","विडंबना","वितरण","वित्तीय","विदेश","विद्यालय", "विधान","विधि","विनाश","विनियमन","विपणन","विपत्र","विफल","विभाग","विभिन्न","विमान","विराम","विरुद्ध","विरोध","विलंब","विलाप","विलोम","विवरण","विवाहित","विविधता","विशाल","विशिष्ट", "विशेष","विश्वविद्यालय","विषय","विषैला","विस्तार","वीडियो","वृत्त","वृद्धि","वेतन","वेबसाइट","वेस्टर्न","वैज्ञानिक","वैधता","वैभव","वैश्विक","व्यक्तिगत","व्यय","व्यवहार","व्यस्त","व्यापार","व्हेल","शक्ति", "शनिवार","शब्द","शयनकक्ष","शरणार्थी","शराब","शर्त","शर्मिंदा","शलाका","शहरी","शांति","शादी","शानदार","शामिल","शायद","शायरी","शारीरिक","शार्क","शासनादेश","शास्वत","शिकार","शिक्षक", "शिखर","शिविर","शिशु","शीघ्र","शीर्षक","शील्ड","शुक्रवार","शुद्ध","शुरु","शुरू","शुल्क","शूटिंग","शून्य","शेरिफ","शेल्फ","शैक्षिक","शैतान","शैली","शोधकर्ता","शोहरत","शौचालय","श्रम","श्रृंखला", "श्रेष्ठ","श्रोता","षड़यंत्र","संकट","संकल्पना","संकाय","संकीर्ण","संकेत","संकोची","संक्रमण","संख्या","संगठन","संगणक","संगीत","संग्रह","संघीय","संचार","संज्ञानात्मक","संतरा","संतुलन","संतोषजनक", "संदर्भ","संदेश","संधि","संपत्ति","संपदा","संपर्क","संपादक","संपूर्ण","संबंध","संबद्ध","संभवत:","संभावना","संयुक्त","संयोजन","संरक्षण","संरचना","संरेखित","संवाद","संविधान","संवेदनशील","संवैधानिक", "संशोधन","संसद","संसाधन","संस्कृति","सकारात्मक","सक्रिय","सक्षम","सख्त","सगाई","सचमुच","सचिव","सचेत","सज़ा","सज्जन","सटीक","सड़क","सत्तारूढ़","सत्य","सत्र","सदमा","सदस्य","सनकी", "सनसनी","सपना","सप्ताह","सफलता","सफ़र","सबजी","सबूत","सब्सिडी","सभ्य","समकक्ष","समकालीन","समझना","समझाना","समझौता","समतल","समन्वयक","समर्थक","समलैंगिक","समाचार","समाज", "समानता","समाप्त","समायोजन","समारोह","समावेश","समिति","समीक्षा","समीर","समुदाय","समूह","समेत","सम्बंधित","सम्मेलन","सम्राट","सरकार","सरणी","सरदर्द","सरलता","सराहना","सर्किट","सर्दी", "सर्वेक्षण","सलाद","सलाह","सवारी","सस्ता","सहना","सहमति","सहयोग","सहानुभूति","सहायता","सहारा","सहेजें","साँप","सांख्यिकीय","सांड","सांस्कृतिक","साइकिल","साइडबार","साक्षात्कार","सागरतट", "साझा","साझेदारी","सातवीं","साथी","साधन","साधारण","साप्ताहिक","साबुन","सामग्री","सामने","सामरिक","सामाजिक","सामूहिक","साम्राज्य","साया","सारांश","सार्थक","सालगिरह","सावधान","साहसिक", "साहित्य","सिंड्रोम","सिंह","सिकोड़ना","सिक्का","सिखाना","सिगरेट","सिटिज़नशिप","सितंबर","सितारा","सिद्धांत","सींग","सीईओ","सीखना","सीडी","सीढ़ी","सीधा","सीधे","सीनेटर","सीमा","सीमित","सीरियाई", "सुंदर","सुइट","सुखद","सुझाव","सुदृढ़","सुधारें","सुनना","सुनवाई","सुनो","सुप्रीम","सुरंग","सुरक्षा","सुरुचिपूर्ण","सुविधा","सूंड","सूअर","सूखा","सूचक","सूचना","सूची","सूत्र","सेंकना","सेंट","सेंसर", "सेना","सेलिब्रिटी","सेवा","सैंडविच","सैद्धांतिक","सैन्य","सैल्मन","सॉफ्टवेयर","सोडा","सोडियम","सोदागर","सोना","सोफ़ा","सोमवार","सोवियत","सौजन्य","सौदा","सौम्य","स्कर्ट","स्काउट","स्की","स्केल", "स्कैन","स्कोर","स्क्रीन","स्टार्टर","स्टूडियो","स्टेशन","स्टैंड","स्तंभ","स्तन","स्तर","स्थल","स्थानीय","स्थिति","स्नानघर","स्पर्श","स्पष्ट","स्पार्क","स्पीड","स्पेनिश","स्मारक","स्मृति","स्रोत","स्लैम","स्वचालित", "स्वतंत्र","स्वदेशी","स्वयं","स्वर्ण","स्वस्थ","स्वास्थ्य","स्विच","स्वीकार्य","हंसी","हज़ार","हटाना","हड़ताल","हड्डी","हत्या","हथियार","हथेली","हथौड़ा","हमारी","हमेशा","हम्म","हरकारा","हराना","हर्ष","हलचल", "हल्का","हसना","हस्तक्षेप","हांफी","हाइवे","हाथी","हानि","हार्डवेयर","हालाँकि","हालिया","हाशिया","हास्यास्पद","हिंसा","हिचकिचाना","हिदायत","हिम्मत","हिरासत","हिलाना","हिसाब","हिस्से","हीरा","हेलमेट", "हेलीकॉप्टर","हेलोवीन","हैंडल","हॉकी","होटल","होना","होशियार"]; // HINDI_ORIGINAL_WORDLIST // let filepath = "./HI_5000_words.txt"; let filepath = "./HI_2968_words_w_freq.txt"; let wordlist = []; const data = fs.readFileSync(filepath, { encoding: 'utf8', flag: 'r' }); const remove_words = [ "eνen", "belieνed","braνe", "haνe","mišiæ","neèeš","osjeèaš","predomišljamo","preuzimaš","sjeèaš","treνor","zaštititmo", "božiæe","odgodiš","propatiš","protiviš","suzdržavaj","upuštaš","vošca", "obeèavaš","predomišljaš","pretjeruješ", "promjeniš","smrzavaš","udaješ"]; let input_words = data.split('\r\n'); let word_count = 1; let first_four_prefixes = []; let new_words = []; const updateFirstFourPrefixes = ( words ) => { let first_four_prefixes = []; for (let i=0; i < words.length; i++) { let prefix = words[i].substring(0, 4); if ( ! first_four_prefixes.includes(prefix) ) { // console.log( "new prefix: '" + prefix + "'"); first_four_prefixes.push(prefix); } } return first_four_prefixes; }; // updateFirstFourPrefixes() const getNewWordList = ( input_wordlist, previous_wordlist ) => { let new_wordlist = []; let common_wordlist = []; for (let i=0; i < input_wordlist.length; i++) { let input_word = input_wordlist[i].toLowerCase(); if ( ! previous_wordlist.includes(input_word) ) { //console.log( "input_word[" + word_count++ + "] : '" + input_word + "'"); if ( input_word.length >= 4 ) { new_wordlist.push(input_word); } } else { //console.log( "input_word: " + input_word + " ALREADY in dictionary"); common_wordlist.push(input_word); } } return new_wordlist; }; // getNewWordList() const FuseWordlists = (previous_wordlist, new_wordlist, used_prefixes, expected_size) => { let fused_wordlists = previous_wordlist; console.log("fused_wordlists: " + fused_wordlists.length); for (let i=0; i < new_wordlist.length; i++) { let new_word = new_wordlist[i].toLowerCase(); console.log("word[" + i + "] : '" + new_word + "'"); if ( previous_wordlist.indexOf(new_word) == -1 ) { // console.log("1. word : '" + new_word + "' is not in 'previous_wordlist'"); let items = new_word.split(" "); let frequency = 10000; if (items.length > 1) { new_word = items[0]; frequency = items[1]; } if ( new_word.length >= 3) { // console.log("2. word : '" + new_word + "' has length >= 4"); let prefix = new_word.substring(0, 4); // console.log("3. word prefix of '" + new_word + "' is '" + prefix + "'"); let prefix_index = used_prefixes.indexOf(prefix); // https://www.geeksforgeeks.org/javascript/javascript-program-to-check-if-a-string-contains-only-alphabetic-characters/ let isAlphabetic = /^[A-zÀ-ú]+$/.test(new_word); let is_in_remove = remove_words.indexOf(new_word) != -1; if ( ! used_prefixes.includes(prefix) && new_word.indexOf(' ')==-1 && !isAlphabetic && !is_in_remove && frequency > 5) { console.log("4. word prefix: '" + prefix + "' of '" + new_word + "' is not in 'used_prefixes'"); fused_wordlists.push(new_word); first_four_prefixes.push(prefix); if (fused_wordlists.length == expected_size) { return fused_wordlists; } } else { // console.log("5. word prefix: '" + prefix + "' of '" + new_word + "' is ALREADY in 'used_prefixes' index: " + prefix_index); } } } } return fused_wordlists; }; // FuseWordlists() first_four_prefixes = updateFirstFourPrefixes(HINDI_ORIGINAL_WORDLIST); console.log( "first_four_prefixes step 1: " + first_four_prefixes.length); let new_hindi_wordlist = getNewWordList(input_words, HINDI_ORIGINAL_WORDLIST); // first_four_prefixes = updateFirstFourPrefixes(new_hindi_wordlist); console.log( "first_four_prefixes step 2: " + first_four_prefixes.length); let hindi_wordlist = FuseWordlists(HINDI_ORIGINAL_WORDLIST, new_hindi_wordlist, first_four_prefixes, 2048); console.log( "hindi_wordlist: " + hindi_wordlist.length); hindi_wordlist.sort(); console.log( "hindi_wordlist: " + JSON.stringify(hindi_wordlist));