UNPKG

article-parser

Version:

To extract main article from given URL

demos.pwshub.com/article-parser

ndaidong/article-parser

29 lines (22 loc) • 1.08 kB

JavaScript

// extractWithReadability.test /* eslint-env jest */ import { readFileSync } from 'fs' import { isString } from 'bellajs' import extractWithReadability, { extractTitleWithReadability } from './extractWithReadability.js' test('test extractWithReadability from good html content', async () => { const html = readFileSync('./test-data/regular-article.html', 'utf8') const result = extractWithReadability(html, 'https://foo.bar') expect(isString(result)).toBe(true) expect(result.length > 200).toBe(true) expect(result).toEqual(expect.stringContaining('<img src="https://foo.bar/orange.png">')) }) test('test extractWithReadability from bad html content', async () => { expect(extractWithReadability(null)).toBe(null) expect(extractWithReadability({})).toBe(null) expect(extractWithReadability('<div></span>')).toBe(null) }) test('test extractTitleWithReadability', async () => { const html = readFileSync('./test-data/regular-article.html', 'utf8') const result = extractTitleWithReadability(html) expect(result).toBe('Article title here - ArticleParser') })