UNPKG

react-xml-viewer

Version:

Simple and configurable React component to prettify XMLs. >

github.com/alissonmbr/react-xml-viewer

alissonmbr/react-xml-viewer

1,739 lines (1,591 loc) • 80 kB

JavaScript

import stream from 'stream'; import string_decoder from 'string_decoder'; import React from 'react'; import PropTypes from 'prop-types'; function createCommonjsModule(fn, module) { return module = { exports: {} }, fn(module, module.exports), module.exports; } var sax = createCommonjsModule(function (module, exports) { (function (sax) { // wrapper for non-node envs sax.parser = function (strict, opt) { return new SAXParser(strict, opt) }; sax.SAXParser = SAXParser; sax.SAXStream = SAXStream; sax.createStream = createStream; // When we pass the MAX_BUFFER_LENGTH position, start checking for buffer overruns. // When we check, schedule the next check for MAX_BUFFER_LENGTH - (max(buffer lengths)), // since that's the earliest that a buffer overrun could occur. This way, checks are // as rare as required, but as often as necessary to ensure never crossing this bound. // Furthermore, buffers are only tested at most once per write(), so passing a very // large string into write() might have undesirable effects, but this is manageable by // the caller, so it is assumed to be safe. Thus, a call to write() may, in the extreme // edge case, result in creating at most one complete copy of the string passed in. // Set to Infinity to have unlimited buffers. sax.MAX_BUFFER_LENGTH = 64 * 1024; var buffers = [ 'comment', 'sgmlDecl', 'textNode', 'tagName', 'doctype', 'procInstName', 'procInstBody', 'entity', 'attribName', 'attribValue', 'cdata', 'script' ]; sax.EVENTS = [ 'text', 'processinginstruction', 'sgmldeclaration', 'doctype', 'comment', 'opentagstart', 'attribute', 'opentag', 'closetag', 'opencdata', 'cdata', 'closecdata', 'error', 'end', 'ready', 'script', 'opennamespace', 'closenamespace' ]; function SAXParser (strict, opt) { if (!(this instanceof SAXParser)) { return new SAXParser(strict, opt) } var parser = this; clearBuffers(parser); parser.q = parser.c = ''; parser.bufferCheckPosition = sax.MAX_BUFFER_LENGTH; parser.opt = opt || {}; parser.opt.lowercase = parser.opt.lowercase || parser.opt.lowercasetags; parser.looseCase = parser.opt.lowercase ? 'toLowerCase' : 'toUpperCase'; parser.tags = []; parser.closed = parser.closedRoot = parser.sawRoot = false; parser.tag = parser.error = null; parser.strict = !!strict; parser.noscript = !!(strict || parser.opt.noscript); parser.state = S.BEGIN; parser.strictEntities = parser.opt.strictEntities; parser.ENTITIES = parser.strictEntities ? Object.create(sax.XML_ENTITIES) : Object.create(sax.ENTITIES); parser.attribList = []; // namespaces form a prototype chain. // it always points at the current tag, // which protos to its parent tag. if (parser.opt.xmlns) { parser.ns = Object.create(rootNS); } // mostly just for error reporting parser.trackPosition = parser.opt.position !== false; if (parser.trackPosition) { parser.position = parser.line = parser.column = 0; } emit(parser, 'onready'); } if (!Object.create) { Object.create = function (o) { function F () {} F.prototype = o; var newf = new F(); return newf }; } if (!Object.keys) { Object.keys = function (o) { var a = []; for (var i in o) if (o.hasOwnProperty(i)) a.push(i); return a }; } function checkBufferLength (parser) { var maxAllowed = Math.max(sax.MAX_BUFFER_LENGTH, 10); var maxActual = 0; for (var i = 0, l = buffers.length; i < l; i++) { var len = parser[buffers[i]].length; if (len > maxAllowed) { // Text/cdata nodes can get big, and since they're buffered, // we can get here under normal conditions. // Avoid issues by emitting the text node now, // so at least it won't get any bigger. switch (buffers[i]) { case 'textNode': closeText(parser); break case 'cdata': emitNode(parser, 'oncdata', parser.cdata); parser.cdata = ''; break case 'script': emitNode(parser, 'onscript', parser.script); parser.script = ''; break default: error(parser, 'Max buffer length exceeded: ' + buffers[i]); } } maxActual = Math.max(maxActual, len); } // schedule the next check for the earliest possible buffer overrun. var m = sax.MAX_BUFFER_LENGTH - maxActual; parser.bufferCheckPosition = m + parser.position; } function clearBuffers (parser) { for (var i = 0, l = buffers.length; i < l; i++) { parser[buffers[i]] = ''; } } function flushBuffers (parser) { closeText(parser); if (parser.cdata !== '') { emitNode(parser, 'oncdata', parser.cdata); parser.cdata = ''; } if (parser.script !== '') { emitNode(parser, 'onscript', parser.script); parser.script = ''; } } SAXParser.prototype = { end: function () { end(this); }, write: write, resume: function () { this.error = null; return this }, close: function () { return this.write(null) }, flush: function () { flushBuffers(this); } }; var Stream; try { Stream = stream.Stream; } catch (ex) { Stream = function () {}; } var streamWraps = sax.EVENTS.filter(function (ev) { return ev !== 'error' && ev !== 'end' }); function createStream (strict, opt) { return new SAXStream(strict, opt) } function SAXStream (strict, opt) { if (!(this instanceof SAXStream)) { return new SAXStream(strict, opt) } Stream.apply(this); this._parser = new SAXParser(strict, opt); this.writable = true; this.readable = true; var me = this; this._parser.onend = function () { me.emit('end'); }; this._parser.onerror = function (er) { me.emit('error', er); // if didn't throw, then means error was handled. // go ahead and clear error, so we can write again. me._parser.error = null; }; this._decoder = null; streamWraps.forEach(function (ev) { Object.defineProperty(me, 'on' + ev, { get: function () { return me._parser['on' + ev] }, set: function (h) { if (!h) { me.removeAllListeners(ev); me._parser['on' + ev] = h; return h } me.on(ev, h); }, enumerable: true, configurable: false }); }); } SAXStream.prototype = Object.create(Stream.prototype, { constructor: { value: SAXStream } }); SAXStream.prototype.write = function (data) { if (typeof Buffer === 'function' && typeof Buffer.isBuffer === 'function' && Buffer.isBuffer(data)) { if (!this._decoder) { var SD = string_decoder.StringDecoder; this._decoder = new SD('utf8'); } data = this._decoder.write(data); } this._parser.write(data.toString()); this.emit('data', data); return true }; SAXStream.prototype.end = function (chunk) { if (chunk && chunk.length) { this.write(chunk); } this._parser.end(); return true }; SAXStream.prototype.on = function (ev, handler) { var me = this; if (!me._parser['on' + ev] && streamWraps.indexOf(ev) !== -1) { me._parser['on' + ev] = function () { var args = arguments.length === 1 ? [arguments[0]] : Array.apply(null, arguments); args.splice(0, 0, ev); me.emit.apply(me, args); }; } return Stream.prototype.on.call(me, ev, handler) }; // this really needs to be replaced with character classes. // XML allows all manner of ridiculous numbers and digits. var CDATA = '[CDATA['; var DOCTYPE = 'DOCTYPE'; var XML_NAMESPACE = 'http://www.w3.org/XML/1998/namespace'; var XMLNS_NAMESPACE = 'http://www.w3.org/2000/xmlns/'; var rootNS = { xml: XML_NAMESPACE, xmlns: XMLNS_NAMESPACE }; // http://www.w3.org/TR/REC-xml/#NT-NameStartChar // This implementation works on strings, a single character at a time // as such, it cannot ever support astral-plane characters (10000-EFFFF) // without a significant breaking change to either this parser, or the // JavaScript language. Implementation of an emoji-capable xml parser // is left as an exercise for the reader. var nameStart = /[:_A-Za-z\u00C0-\u00D6\u00D8-\u00F6\u00F8-\u02FF\u0370-\u037D\u037F-\u1FFF\u200C-\u200D\u2070-\u218F\u2C00-\u2FEF\u3001-\uD7FF\uF900-\uFDCF\uFDF0-\uFFFD]/; var nameBody = /[:_A-Za-z\u00C0-\u00D6\u00D8-\u00F6\u00F8-\u02FF\u0370-\u037D\u037F-\u1FFF\u200C-\u200D\u2070-\u218F\u2C00-\u2FEF\u3001-\uD7FF\uF900-\uFDCF\uFDF0-\uFFFD\u00B7\u0300-\u036F\u203F-\u2040.\d-]/; var entityStart = /[#:_A-Za-z\u00C0-\u00D6\u00D8-\u00F6\u00F8-\u02FF\u0370-\u037D\u037F-\u1FFF\u200C-\u200D\u2070-\u218F\u2C00-\u2FEF\u3001-\uD7FF\uF900-\uFDCF\uFDF0-\uFFFD]/; var entityBody = /[#:_A-Za-z\u00C0-\u00D6\u00D8-\u00F6\u00F8-\u02FF\u0370-\u037D\u037F-\u1FFF\u200C-\u200D\u2070-\u218F\u2C00-\u2FEF\u3001-\uD7FF\uF900-\uFDCF\uFDF0-\uFFFD\u00B7\u0300-\u036F\u203F-\u2040.\d-]/; function isWhitespace (c) { return c === ' ' || c === '\n' || c === '\r' || c === '\t' } function isQuote (c) { return c === '"' || c === '\'' } function isAttribEnd (c) { return c === '>' || isWhitespace(c) } function isMatch (regex, c) { return regex.test(c) } function notMatch (regex, c) { return !isMatch(regex, c) } var S = 0; sax.STATE = { BEGIN: S++, // leading byte order mark or whitespace BEGIN_WHITESPACE: S++, // leading whitespace TEXT: S++, // general stuff TEXT_ENTITY: S++, // &amp and such. OPEN_WAKA: S++, // < SGML_DECL: S++, // <!BLARG SGML_DECL_QUOTED: S++, // <!BLARG foo "bar DOCTYPE: S++, // <!DOCTYPE DOCTYPE_QUOTED: S++, // <!DOCTYPE "//blah DOCTYPE_DTD: S++, // <!DOCTYPE "//blah" [ ... DOCTYPE_DTD_QUOTED: S++, // <!DOCTYPE "//blah" [ "foo COMMENT_STARTING: S++, // <!- COMMENT: S++, //  in non-strict mode, // which is a comment of " blah -- bloo " parser.comment += '--' + c; parser.state = S.COMMENT; } else { parser.state = S.TEXT; } continue case S.CDATA: if (c === ']') { parser.state = S.CDATA_ENDING; } else { parser.cdata += c; } continue case S.CDATA_ENDING: if (c === ']') { parser.state = S.CDATA_ENDING_2; } else { parser.cdata += ']' + c; parser.state = S.CDATA; } continue case S.CDATA_ENDING_2: if (c === '>') { if (parser.cdata) { emitNode(parser, 'oncdata', parser.cdata); } emitNode(parser, 'onclosecdata'); parser.cdata = ''; parser.state = S.TEXT; } else if (c === ']') { parser.cdata += ']'; } else { parser.cdata += ']]' + c; parser.state = S.CDATA; } continue case S.PROC_INST: if (c === '?') { parser.state = S.PROC_INST_ENDING; } else if (isWhitespace(c)) { parser.state = S.PROC_INST_BODY; } else { parser.procInstName += c; } continue case S.PROC_INST_BODY: if (!parser.procInstBody && isWhitespace(c)) { continue } else if (c === '?') { parser.state = S.PROC_INST_ENDING; } else { parser.procInstBody += c; } continue case S.PROC_INST_ENDING: if (c === '>') { emitNode(parser, 'onprocessinginstruction', { name: parser.procInstName, body: parser.procInstBody }); parser.procInstName = parser.procInstBody = ''; parser.state = S.TEXT; } else { parser.procInstBody += '?' + c; parser.state = S.PROC_INST_BODY; } continue case S.OPEN_TAG: if (isMatch(nameBody, c)) { parser.tagName += c; } else { newTag(parser); if (c === '>') { openTag(parser); } else if (c === '/') { parser.state = S.OPEN_TAG_SLASH; } else { if (!isWhitespace(c)) { strictFail(parser, 'Invalid character in tag name'); } parser.state = S.ATTRIB; } } continue case S.OPEN_TAG_SLASH: if (c === '>') { openTag(parser, true); closeTag(parser); } else { strictFail(parser, 'Forward-slash in opening tag not followed by >'); parser.state = S.ATTRIB; } continue case S.ATTRIB: // haven't read the attribute name yet. if (isWhitespace(c)) { continue } else if (c === '>') { openTag(parser); } else if (c === '/') { parser.state = S.OPEN_TAG_SLASH; } else if (isMatch(nameStart, c)) { parser.attribName = c; parser.attribValue = ''; parser.state = S.ATTRIB_NAME; } else { strictFail(parser, 'Invalid attribute name'); } continue case S.ATTRIB_NAME: if (c === '=') { parser.state = S.ATTRIB_VALUE; } else if (c === '>') { strictFail(parser, 'Attribute without value'); parser.attribValue = parser.attribName; attrib(parser); openTag(parser); } else if (isWhitespace(c)) { parser.state = S.ATTRIB_NAME_SAW_WHITE; } else if (isMatch(nameBody, c)) { parser.attribName += c; } else { strictFail(parser, 'Invalid attribute name'); } continue case S.ATTRIB_NAME_SAW_WHITE: if (c === '=') { parser.state = S.ATTRIB_VALUE; } else if (isWhitespace(c)) { continue } else { strictFail(parser, 'Attribute without value'); parser.tag.attributes[parser.attribName] = ''; parser.attribValue = ''; emitNode(parser, 'onattribute', { name: parser.attribName, value: '' }); parser.attribName = ''; if (c === '>') { openTag(parser); } else if (isMatch(nameStart, c)) { parser.attribName = c; parser.state = S.ATTRIB_NAME; } else { strictFail(parser, 'Invalid attribute name'); parser.state = S.ATTRIB; } } continue case S.ATTRIB_VALUE: if (isWhitespace(c)) { continue } else if (isQuote(c)) { parser.q = c; parser.state = S.ATTRIB_VALUE_QUOTED; } else { strictFail(parser, 'Unquoted attribute value'); parser.state = S.ATTRIB_VALUE_UNQUOTED; parser.attribValue = c; } continue case S.ATTRIB_VALUE_QUOTED: if (c !== parser.q) { if (c === '&') { parser.state = S.ATTRIB_VALUE_ENTITY_Q; } else { parser.attribValue += c; } continue } attrib(parser); parser.q = ''; parser.state = S.ATTRIB_VALUE_CLOSED; continue case S.ATTRIB_VALUE_CLOSED: if (isWhitespace(c)) { parser.state = S.ATTRIB; } else if (c === '>') { openTag(parser); } else if (c === '/') { parser.state = S.OPEN_TAG_SLASH; } else if (isMatch(nameStart, c)) { strictFail(parser, 'No whitespace between attributes'); parser.attribName = c; parser.attribValue = ''; parser.state = S.ATTRIB_NAME; } else { strictFail(parser, 'Invalid attribute name'); } continue case S.ATTRIB_VALUE_UNQUOTED: if (!isAttribEnd(c)) { if (c === '&') { parser.state = S.ATTRIB_VALUE_ENTITY_U; } else { parser.attribValue += c; } continue } attrib(parser); if (c === '>') { openTag(parser); } else { parser.state = S.ATTRIB; } continue case S.CLOSE_TAG: if (!parser.tagName) { if (isWhitespace(c)) { continue } else if (notMatch(nameStart, c)) { if (parser.script) { parser.script += '</' + c; parser.state = S.SCRIPT; } else { strictFail(parser, 'Invalid tagname in closing tag.'); } } else { parser.tagName = c; } } else if (c === '>') { closeTag(parser); } else if (isMatch(nameBody, c)) { parser.tagName += c; } else if (parser.script) { parser.script += '</' + parser.tagName; parser.tagName = ''; parser.state = S.SCRIPT; } else { if (!isWhitespace(c)) { strictFail(parser, 'Invalid tagname in closing tag'); } parser.state = S.CLOSE_TAG_SAW_WHITE; } continue case S.CLOSE_TAG_SAW_WHITE: if (isWhitespace(c)) { continue } if (c === '>') { closeTag(parser); } else { strictFail(parser, 'Invalid characters in closing tag'); } continue case S.TEXT_ENTITY: case S.ATTRIB_VALUE_ENTITY_Q: case S.ATTRIB_VALUE_ENTITY_U: var returnState; var buffer; switch (parser.state) { case S.TEXT_ENTITY: returnState = S.TEXT; buffer = 'textNode'; break case S.ATTRIB_VALUE_ENTITY_Q: returnState = S.ATTRIB_VALUE_QUOTED; buffer = 'attribValue'; break case S.ATTRIB_VALUE_ENTITY_U: returnState = S.ATTRIB_VALUE_UNQUOTED; buffer = 'attribValue'; break } if (c === ';') { parser[buffer] += parseEntity(parser); parser.entity = ''; parser.state = returnState; } else if (isMatch(parser.entity.length ? entityBody : entityStart, c)) { parser.entity += c; } else { strictFail(parser, 'Invalid character in entity name'); parser[buffer] += '&' + parser.entity + c; parser.entity = ''; parser.state = returnState; } continue default: throw new Error(parser, 'Unknown state: ' + parser.state) } } // while if (parser.position >= parser.bufferCheckPosition) { checkBufferLength(parser); } return parser } /*! http://mths.be/fromcodepoint v0.1.0 by @mathias */ /* istanbul ignore next */ if (!String.fromCodePoint) { (function () { var stringFromCharCode = String.fromCharCode; var floor = Math.floor; var fromCodePoint = function () { var MAX_SIZE = 0x4000; var codeUnits = []; var highSurrogate; var lowSurrogate; var index = -1; var length = arguments.length; if (!length) { return '' } var result = ''; while (++index < length) { var codePoint = Number(arguments[index]); if ( !isFinite(codePoint) || // `NaN`, `+Infinity`, or `-Infinity` codePoint < 0 || // not a valid Unicode code point codePoint > 0x10FFFF || // not a valid Unicode code point floor(codePoint) !== codePoint // not an integer ) { throw RangeError('Invalid code point: ' + codePoint) } if (codePoint <= 0xFFFF) { // BMP code point codeUnits.push(codePoint); } else { // Astral code point; split in surrogate halves // http://mathiasbynens.be/notes/javascript-encoding#surrogate-formulae codePoint -= 0x10000; highSurrogate = (codePoint >> 10) + 0xD800; lowSurrogate = (codePoint % 0x400) + 0xDC00; codeUnits.push(highSurrogate, lowSurrogate); } if (index + 1 === length || codeUnits.length > MAX_SIZE) { result += stringFromCharCode.apply(null, codeUnits); codeUnits.length = 0; } } return result }; /* istanbul ignore next */ if (Object.defineProperty) { Object.defineProperty(String, 'fromCodePoint', { value: fromCodePoint, configurable: true, writable: true }); } else { String.fromCodePoint = fromCodePoint; } }()); } })(exports); }); var arrayHelper = { isArray: function(value) { if (Array.isArray) { return Array.isArray(value); } // fallback for older browsers like IE 8 return Object.prototype.toString.call( value ) === '[object Array]'; } }; var isArray = arrayHelper.isArray; var optionsHelper = { copyOptions: function (options) { var key, copy = {}; for (key in options) { if (options.hasOwnProperty(key)) { copy[key] = options[key]; } } return copy; }, ensureFlagExists: function (item, options) { if (!(item in options) || typeof options[item] !== 'boolean') { options[item] = false; } }, ensureSpacesExists: function (options) { if (!('spaces' in options) || (typeof options.spaces !== 'number' && typeof options.spaces !== 'string')) { options.spaces = 0; } }, ensureAlwaysArrayExists: function (options) { if (!('alwaysArray' in options) || (typeof options.alwaysArray !== 'boolean' && !isArray(options.alwaysArray))) { options.alwaysArray = false; } }, ensureKeyExists: function (key, options) { if (!(key + 'Key' in options) || typeof options[key + 'Key'] !== 'string') { options[key + 'Key'] = options.compact ? '_' + key : key; } }, checkFnExists: function (key, options) { return key + 'Fn' in options; } }; var isArray$1 = arrayHelper.isArray; var options; var currentElement; function validateOptions(userOptions) { options = optionsHelper.copyOptions(userOptions); optionsHelper.ensureFlagExists('ignoreDeclaration', options); optionsHelper.ensureFlagExists('ignoreInstruction', options); optionsHelper.ensureFlagExists('ignoreAttributes', options); optionsHelper.ensureFlagExists('ignoreText', options); optionsHelper.ensureFlagExists('ignoreComment', options); optionsHelper.ensureFlagExists('ignoreCdata', options); optionsHelper.ensureFlagExists('ignoreDoctype', options); optionsHelper.ensureFlagExists('compact', options); optionsHelper.ensureFlagExists('alwaysChildren', options); optionsHelper.ensureFlagExists('addParent', options); optionsHelper.ensureFlagExists('trim', options); optionsHelper.ensureFlagExists('nativeType', options); optionsHelper.ensureFlagExists('nativeTypeAttributes', options); optionsHelper.ensureFlagExists('sanitize', options); optionsHelper.ensureFlagExists('instructionHasAttributes', options); optionsHelper.ensureFlagExists('captureSpacesBetweenElements', options); optionsHelper.ensureAlwaysArrayExists(options); optionsHelper.ensureKeyExists('declaration', options); optionsHelper.ensureKeyExists('instruction', options); optionsHelper.ensureKeyExists('attributes', options); optionsHelper.ensureKeyExists('text', options); optionsHelper.ensureKeyExists('comment', options); optionsHelper.ensureKeyExists('cdata', options); optionsHelper.ensureKeyExists('doctype', options); optionsHelper.ensureKeyExists('type', options); optionsHelper.ensureKeyExists('name', options); optionsHelper.ensureKeyExists('elements', options); optionsHelper.ensureKeyExists('parent', options); return options; } function nativeType(value) { var nValue = Number(value); if (!isNaN(nValue)) { return nValue; } var bValue = value.toLowerCase(); if (bValue === 'true') { return true; } else if (bValue === 'false') { return false; } return value; } function addField(type, value) { var key; if (options.compact) { if ( !currentElement[options[type + 'Key']] && (isArray$1(options.alwaysArray) ? options.alwaysArray.indexOf(options[type + 'Key']) !== -1 : options.alwaysArray) ) { currentElement[options[type + 'Key']] = []; } if (currentElement[options[type + 'Key']] && !isArray$1(currentElement[options[type + 'Key']])) { currentElement[options[type + 'Key']] = [currentElement[options[type + 'Key']]]; } if (type + 'Fn' in options && typeof value === 'string') { value = options[type + 'Fn'](value, currentElement); } if (type === 'instruction' && ('instructionFn' in options || 'instructionNameFn' in options)) { for (key in value) { if (value.hasOwnProperty(key)) { if ('instructionFn' in options) { value[key] = options.instructionFn(value[key], key, currentElement); } else { var temp = value[key]; delete value[key]; value[options.instructionNameFn(key, temp, currentElement)] = temp; } } } } if (isArray$1(currentElement[options[type + 'Key']])) { currentElement[options[type + 'Key']].push(value); } else { currentElement[options[type + 'Key']] = value; } } else { if (!currentElement[options.elementsKey]) { currentElement[options.elementsKey] = []; } var element = {}; element[options.typeKey] = type; if (type === 'instruction') { for (key in value) { if (value.hasOwnProperty(key)) { break; } } element[options.nameKey] = 'instructionNameFn' in options ? options.instructionNameFn(key, value, currentElement) : key; if (options.instructionHasAttributes) { element[options.attributesKey] = value[key][options.attributesKey]; if ('instructionFn' in options) { element[options.attributesKey] = options.instructionFn(element[options.attributesKey], key, currentElement); } } else { if ('instructionFn' in options) { value[key] = options.instructionFn(value[key], key, currentElement); } element[options