UNPKG

gpt-tokenizer

Version:

A pure JavaScript implementation of a BPE tokenizer (Encoder/Decoder) for GPT-2 / GPT-3 / GPT-4 and other OpenAI models

github.com/niieani/gpt-tokenizer

niieani/gpt-tokenizer

14 lines • 529 B

JavaScript

"use strict"; Object.defineProperty(exports, "__esModule", { value: true }); exports.R50KBase = R50KBase; const specialTokens_js_1 = require("../specialTokens.js"); const constants_js_1 = require("./constants.js"); function R50KBase(bytePairRankDecoder) { return { expectedVocabularySize: 50_257, tokenSplitRegex: constants_js_1.R50K_TOKEN_SPLIT_REGEX, bytePairRankDecoder, specialTokensEncoder: new Map([[specialTokens_js_1.EndOfText, 50_256]]), }; } //# sourceMappingURL=r50k_base.js.map