UNPKG

tipograph

Version:

A little javascript library and command line tool that makes your written content more typographically correct.

github.com/nevyk/tipograph

nevyk/tipograph

157 lines (144 loc) • 4.89 kB

JavaScript

/// #### html /// /// HTML tags are kept as they are. Moreover, it also preserves whole contents of the following tags: pre, code, style, /// script. export default function () { return function (input) { var result = null; var last = 0; var output = []; while ((result = findTag(input, last)) !== null) { output.push({ transform: true, content: input.slice(last, result[0]) }); output.push({ transform: false, content: input.slice(result[0], result[1]) }); last = result[1]; } output.push({ transform: true, content: input.slice(last) }); return output; }; } function findTag(input, last) { // global flag needed for setting `lastIndex` property when doing `exec` var pattern = /<[/!]?[a-z][a-z0-9-_]*|/g; pattern.lastIndex = last; var result = null; if ((result = pattern.exec(input)) !== null) { return result.index + 3; } else { return input.length; } } export function tests() { return [ { description: 'pair tags', input: 'lorem <b>ipsum</b> dolor', expected: 'lorem ipsum dolor' }, { description: 'single tag', input: 'lorem <br />ipsum<br> dolor', expected: 'lorem ipsum dolor' }, { description: 'pre tag', input: 'lorem <pre>ipsum</pre> dolor', expected: 'lorem dolor' }, { description: 'code tag', input: 'lorem <code>ipsum</code> dolor', expected: 'lorem dolor' }, { description: 'custom tag starting with pre', input: 'lorem <precision>ipsum</precision> dolor', expected: 'lorem ipsum dolor' }, { description: 'custom tag starting with code', input: 'lorem <codec>ipsum</codec> dolor', expected: 'lorem ipsum dolor' }, { description: 'style tag', input: '<style>\nhtml { height: 100%; }\n</style>', expected: '' }, { description: 'script tag', input: '<script>\nconsole.log("Hello world!")\n</script>', expected: '' }, { description: 'multiple scripts', input: '<script>lorem</script> ipsum <script>dolor</script>', expected: ' ipsum ' }, { description: 'complex attributes', input: '<i class="is this > even\\" legit?">lorem</i>', expected: 'lorem' }, { description: 'html comments', input: 'lorem  ipsum', expected: 'lorem ipsum', }, { description: 'doctype', input: '<!DOCTYPE html>', expected: '', } ]; }