UNPKG

@ai-sdk/google-vertex

Version:

The **[Google Vertex provider](https://ai-sdk.dev/providers/ai-sdk-providers/google-vertex)** for the [AI SDK](https://ai-sdk.dev/docs) contains language model support for the [Google Vertex AI](https://cloud.google.com/vertex-ai) APIs.

ai-sdk.dev/docs

561 lines (548 loc) • 19.6 kB

JavaScript

"use strict"; var __defProp = Object.defineProperty; var __getOwnPropDesc = Object.getOwnPropertyDescriptor; var __getOwnPropNames = Object.getOwnPropertyNames; var __hasOwnProp = Object.prototype.hasOwnProperty; var __export = (target, all) => { for (var name in all) __defProp(target, name, { get: all[name], enumerable: true }); }; var __copyProps = (to, from, except, desc) => { if (from && typeof from === "object" || typeof from === "function") { for (let key of __getOwnPropNames(from)) if (!__hasOwnProp.call(to, key) && key !== except) __defProp(to, key, { get: () => from[key], enumerable: !(desc = __getOwnPropDesc(from, key)) || desc.enumerable }); } return to; }; var __toCommonJS = (mod) => __copyProps(__defProp({}, "__esModule", { value: true }), mod); // src/index.ts var src_exports = {}; __export(src_exports, { VERSION: () => VERSION, createVertex: () => createVertex2, vertex: () => vertex }); module.exports = __toCommonJS(src_exports); // src/google-vertex-provider-node.ts var import_provider_utils5 = require("@ai-sdk/provider-utils"); // src/google-vertex-auth-google-auth-library.ts var import_google_auth_library = require("google-auth-library"); var authInstance = null; var authOptions = null; function getAuth(options) { if (!authInstance || options !== authOptions) { authInstance = new import_google_auth_library.GoogleAuth({ scopes: ["https://www.googleapis.com/auth/cloud-platform"], ...options }); authOptions = options; } return authInstance; } async function generateAuthToken(options) { const auth = getAuth(options || {}); const client = await auth.getClient(); const token = await client.getAccessToken(); return (token == null ? void 0 : token.token) || null; } // src/google-vertex-provider.ts var import_internal2 = require("@ai-sdk/google/internal"); var import_provider_utils4 = require("@ai-sdk/provider-utils"); // src/version.ts var VERSION = true ? "4.0.28" : "0.0.0-test"; // src/google-vertex-embedding-model.ts var import_provider = require("@ai-sdk/provider"); var import_provider_utils2 = require("@ai-sdk/provider-utils"); var import_v43 = require("zod/v4"); // src/google-vertex-error.ts var import_provider_utils = require("@ai-sdk/provider-utils"); var import_v4 = require("zod/v4"); var googleVertexErrorDataSchema = import_v4.z.object({ error: import_v4.z.object({ code: import_v4.z.number().nullable(), message: import_v4.z.string(), status: import_v4.z.string() }) }); var googleVertexFailedResponseHandler = (0, import_provider_utils.createJsonErrorResponseHandler)( { errorSchema: googleVertexErrorDataSchema, errorToMessage: (data) => data.error.message } ); // src/google-vertex-embedding-options.ts var import_v42 = require("zod/v4"); var googleVertexEmbeddingProviderOptions = import_v42.z.object({ /** * Optional. Optional reduced dimension for the output embedding. * If set, excessive values in the output embedding are truncated from the end. */ outputDimensionality: import_v42.z.number().optional(), /** * Optional. Specifies the task type for generating embeddings. * Supported task types: * - SEMANTIC_SIMILARITY: Optimized for text similarity. * - CLASSIFICATION: Optimized for text classification. * - CLUSTERING: Optimized for clustering texts based on similarity. * - RETRIEVAL_DOCUMENT: Optimized for document retrieval. * - RETRIEVAL_QUERY: Optimized for query-based retrieval. * - QUESTION_ANSWERING: Optimized for answering questions. * - FACT_VERIFICATION: Optimized for verifying factual information. * - CODE_RETRIEVAL_QUERY: Optimized for retrieving code blocks based on natural language queries. */ taskType: import_v42.z.enum([ "SEMANTIC_SIMILARITY", "CLASSIFICATION", "CLUSTERING", "RETRIEVAL_DOCUMENT", "RETRIEVAL_QUERY", "QUESTION_ANSWERING", "FACT_VERIFICATION", "CODE_RETRIEVAL_QUERY" ]).optional(), /** * Optional. The title of the document being embedded. * Only valid when task_type is set to 'RETRIEVAL_DOCUMENT'. * Helps the model produce better embeddings by providing additional context. */ title: import_v42.z.string().optional(), /** * Optional. When set to true, input text will be truncated. When set to false, * an error is returned if the input text is longer than the maximum length supported by the model. Defaults to true. */ autoTruncate: import_v42.z.boolean().optional() }); // src/google-vertex-embedding-model.ts var GoogleVertexEmbeddingModel = class { constructor(modelId, config) { this.specificationVersion = "v3"; this.maxEmbeddingsPerCall = 2048; this.supportsParallelCalls = true; this.modelId = modelId; this.config = config; } get provider() { return this.config.provider; } async doEmbed({ values, headers, abortSignal, providerOptions }) { let googleOptions = await (0, import_provider_utils2.parseProviderOptions)({ provider: "vertex", providerOptions, schema: googleVertexEmbeddingProviderOptions }); if (googleOptions == null) { googleOptions = await (0, import_provider_utils2.parseProviderOptions)({ provider: "google", providerOptions, schema: googleVertexEmbeddingProviderOptions }); } googleOptions = googleOptions != null ? googleOptions : {}; if (values.length > this.maxEmbeddingsPerCall) { throw new import_provider.TooManyEmbeddingValuesForCallError({ provider: this.provider, modelId: this.modelId, maxEmbeddingsPerCall: this.maxEmbeddingsPerCall, values }); } const mergedHeaders = (0, import_provider_utils2.combineHeaders)( await (0, import_provider_utils2.resolve)(this.config.headers), headers ); const url = `${this.config.baseURL}/models/${this.modelId}:predict`; const { responseHeaders, value: response, rawValue } = await (0, import_provider_utils2.postJsonToApi)({ url, headers: mergedHeaders, body: { instances: values.map((value) => ({ content: value, task_type: googleOptions.taskType, title: googleOptions.title })), parameters: { outputDimensionality: googleOptions.outputDimensionality, autoTruncate: googleOptions.autoTruncate } }, failedResponseHandler: googleVertexFailedResponseHandler, successfulResponseHandler: (0, import_provider_utils2.createJsonResponseHandler)( googleVertexTextEmbeddingResponseSchema ), abortSignal, fetch: this.config.fetch }); return { warnings: [], embeddings: response.predictions.map( (prediction) => prediction.embeddings.values ), usage: { tokens: response.predictions.reduce( (tokenCount, prediction) => tokenCount + prediction.embeddings.statistics.token_count, 0 ) }, response: { headers: responseHeaders, body: rawValue } }; } }; var googleVertexTextEmbeddingResponseSchema = import_v43.z.object({ predictions: import_v43.z.array( import_v43.z.object({ embeddings: import_v43.z.object({ values: import_v43.z.array(import_v43.z.number()), statistics: import_v43.z.object({ token_count: import_v43.z.number() }) }) }) ) }); // src/google-vertex-image-model.ts var import_provider_utils3 = require("@ai-sdk/provider-utils"); var import_v44 = require("zod/v4"); var GoogleVertexImageModel = class { constructor(modelId, config) { this.modelId = modelId; this.config = config; this.specificationVersion = "v3"; // https://cloud.google.com/vertex-ai/generative-ai/docs/model-reference/imagen-api#parameter_list this.maxImagesPerCall = 4; } get provider() { return this.config.provider; } async doGenerate({ prompt, n, size, aspectRatio, seed, providerOptions, headers, abortSignal, files, mask }) { var _a, _b, _c, _d, _e, _f, _g; const warnings = []; if (size != null) { warnings.push({ type: "unsupported", feature: "size", details: "This model does not support the `size` option. Use `aspectRatio` instead." }); } const vertexImageOptions = await (0, import_provider_utils3.parseProviderOptions)({ provider: "vertex", providerOptions, schema: vertexImageProviderOptionsSchema }); const { edit, ...otherOptions } = vertexImageOptions != null ? vertexImageOptions : {}; const { mode: editMode, baseSteps, maskMode, maskDilation } = edit != null ? edit : {}; const isEditMode = files != null && files.length > 0; let body; if (isEditMode) { const referenceImages = []; for (let i = 0; i < files.length; i++) { const file = files[i]; referenceImages.push({ referenceType: "REFERENCE_TYPE_RAW", referenceId: i + 1, referenceImage: { bytesBase64Encoded: getBase64Data(file) } }); } if (mask != null) { referenceImages.push({ referenceType: "REFERENCE_TYPE_MASK", referenceId: files.length + 1, referenceImage: { bytesBase64Encoded: getBase64Data(mask) }, maskImageConfig: { maskMode: maskMode != null ? maskMode : "MASK_MODE_USER_PROVIDED", ...maskDilation != null ? { dilation: maskDilation } : {} } }); } body = { instances: [ { prompt, referenceImages } ], parameters: { sampleCount: n, ...aspectRatio != null ? { aspectRatio } : {}, ...seed != null ? { seed } : {}, editMode: editMode != null ? editMode : "EDIT_MODE_INPAINT_INSERTION", ...baseSteps != null ? { editConfig: { baseSteps } } : {}, ...otherOptions } }; } else { body = { instances: [{ prompt }], parameters: { sampleCount: n, ...aspectRatio != null ? { aspectRatio } : {}, ...seed != null ? { seed } : {}, ...otherOptions } }; } const currentDate = (_c = (_b = (_a = this.config._internal) == null ? void 0 : _a.currentDate) == null ? void 0 : _b.call(_a)) != null ? _c : /* @__PURE__ */ new Date(); const { value: response, responseHeaders } = await (0, import_provider_utils3.postJsonToApi)({ url: `${this.config.baseURL}/models/${this.modelId}:predict`, headers: (0, import_provider_utils3.combineHeaders)(await (0, import_provider_utils3.resolve)(this.config.headers), headers), body, failedResponseHandler: googleVertexFailedResponseHandler, successfulResponseHandler: (0, import_provider_utils3.createJsonResponseHandler)( vertexImageResponseSchema ), abortSignal, fetch: this.config.fetch }); return { images: (_e = (_d = response.predictions) == null ? void 0 : _d.map( ({ bytesBase64Encoded }) => bytesBase64Encoded )) != null ? _e : [], warnings, response: { timestamp: currentDate, modelId: this.modelId, headers: responseHeaders }, providerMetadata: { vertex: { images: (_g = (_f = response.predictions) == null ? void 0 : _f.map((prediction) => { const { // normalize revised prompt property prompt: revisedPrompt } = prediction; return { ...revisedPrompt != null && { revisedPrompt } }; })) != null ? _g : [] } } }; } }; var vertexImageResponseSchema = import_v44.z.object({ predictions: import_v44.z.array( import_v44.z.object({ bytesBase64Encoded: import_v44.z.string(), mimeType: import_v44.z.string(), prompt: import_v44.z.string().nullish() }) ).nullish() }); var vertexImageProviderOptionsSchema = import_v44.z.object({ negativePrompt: import_v44.z.string().nullish(), personGeneration: import_v44.z.enum(["dont_allow", "allow_adult", "allow_all"]).nullish(), safetySetting: import_v44.z.enum([ "block_low_and_above", "block_medium_and_above", "block_only_high", "block_none" ]).nullish(), addWatermark: import_v44.z.boolean().nullish(), storageUri: import_v44.z.string().nullish(), sampleImageSize: import_v44.z.enum(["1K", "2K"]).nullish(), /** * Configuration for image editing operations */ edit: import_v44.z.object({ /** * An integer that represents the number of sampling steps. * A higher value offers better image quality, a lower value offers better latency. * Try 35 steps to start. If the quality doesn't meet your requirements, * increase the value towards an upper limit of 75. */ baseSteps: import_v44.z.number().nullish(), // Edit mode options // https://cloud.google.com/vertex-ai/generative-ai/docs/image/edit-insert-objects mode: import_v44.z.enum([ "EDIT_MODE_INPAINT_INSERTION", "EDIT_MODE_INPAINT_REMOVAL", "EDIT_MODE_OUTPAINT", "EDIT_MODE_CONTROLLED_EDITING", "EDIT_MODE_PRODUCT_IMAGE", "EDIT_MODE_BGSWAP" ]).nullish(), /** * The mask mode to use. * - `MASK_MODE_DEFAULT` - Default value for mask mode. * - `MASK_MODE_USER_PROVIDED` - User provided mask. No segmentation needed. * - `MASK_MODE_DETECTION_BOX` - Mask from detected bounding boxes. * - `MASK_MODE_CLOTHING_AREA` - Masks from segmenting the clothing area with open-vocab segmentation. * - `MASK_MODE_PARSED_PERSON` - Masks from segmenting the person body and clothing using the person-parsing model. */ maskMode: import_v44.z.enum([ "MASK_MODE_DEFAULT", "MASK_MODE_USER_PROVIDED", "MASK_MODE_DETECTION_BOX", "MASK_MODE_CLOTHING_AREA", "MASK_MODE_PARSED_PERSON" ]).nullish(), /** * Optional. A float value between 0 and 1, inclusive, that represents the * percentage of the image width to grow the mask by. Using dilation helps * compensate for imprecise masks. We recommend a value of 0.01. */ maskDilation: import_v44.z.number().nullish() }).nullish() }); function getBase64Data(file) { if (file.type === "url") { throw new Error( "URL-based images are not supported for Google Vertex image editing. Please provide the image data directly." ); } if (typeof file.data === "string") { return file.data; } return (0, import_provider_utils3.convertUint8ArrayToBase64)(file.data); } // src/google-vertex-tools.ts var import_internal = require("@ai-sdk/google/internal"); var googleVertexTools = { googleSearch: import_internal.googleTools.googleSearch, enterpriseWebSearch: import_internal.googleTools.enterpriseWebSearch, googleMaps: import_internal.googleTools.googleMaps, urlContext: import_internal.googleTools.urlContext, fileSearch: import_internal.googleTools.fileSearch, codeExecution: import_internal.googleTools.codeExecution, vertexRagStore: import_internal.googleTools.vertexRagStore }; // src/google-vertex-provider.ts var EXPRESS_MODE_BASE_URL = "https://aiplatform.googleapis.com/v1/publishers/google"; function createExpressModeFetch(apiKey, customFetch) { return async (url, init) => { const modifiedInit = { ...init, headers: { ...(init == null ? void 0 : init.headers) ? (0, import_provider_utils4.normalizeHeaders)(init.headers) : {}, "x-goog-api-key": apiKey } }; return (customFetch != null ? customFetch : fetch)(url.toString(), modifiedInit); }; } function createVertex(options = {}) { const apiKey = (0, import_provider_utils4.loadOptionalSetting)({ settingValue: options.apiKey, environmentVariableName: "GOOGLE_VERTEX_API_KEY" }); const loadVertexProject = () => (0, import_provider_utils4.loadSetting)({ settingValue: options.project, settingName: "project", environmentVariableName: "GOOGLE_VERTEX_PROJECT", description: "Google Vertex project" }); const loadVertexLocation = () => (0, import_provider_utils4.loadSetting)({ settingValue: options.location, settingName: "location", environmentVariableName: "GOOGLE_VERTEX_LOCATION", description: "Google Vertex location" }); const loadBaseURL = () => { var _a, _b; if (apiKey) { return (_a = (0, import_provider_utils4.withoutTrailingSlash)(options.baseURL)) != null ? _a : EXPRESS_MODE_BASE_URL; } const region = loadVertexLocation(); const project = loadVertexProject(); const baseHost = `${region === "global" ? "" : region + "-"}aiplatform.googleapis.com`; return (_b = (0, import_provider_utils4.withoutTrailingSlash)(options.baseURL)) != null ? _b : `https://${baseHost}/v1beta1/projects/${project}/locations/${region}/publishers/google`; }; const createConfig = (name) => { const getHeaders = async () => { var _a; const originalHeaders = await (0, import_provider_utils4.resolve)((_a = options.headers) != null ? _a : {}); return (0, import_provider_utils4.withUserAgentSuffix)( originalHeaders, `ai-sdk/google-vertex/${VERSION}` ); }; return { provider: `google.vertex.${name}`, headers: getHeaders, fetch: apiKey ? createExpressModeFetch(apiKey, options.fetch) : options.fetch, baseURL: loadBaseURL() }; }; const createChatModel = (modelId) => { var _a; return new import_internal2.GoogleGenerativeAILanguageModel(modelId, { ...createConfig("chat"), generateId: (_a = options.generateId) != null ? _a : import_provider_utils4.generateId, supportedUrls: () => ({ "*": [ // HTTP URLs: /^https?:\/\/.*$/, // Google Cloud Storage URLs: /^gs:\/\/.*$/ ] }) }); }; const createEmbeddingModel = (modelId) => new GoogleVertexEmbeddingModel(modelId, createConfig("embedding")); const createImageModel = (modelId) => new GoogleVertexImageModel(modelId, createConfig("image")); const provider = function(modelId) { if (new.target) { throw new Error( "The Google Vertex AI model function cannot be called with the new keyword." ); } return createChatModel(modelId); }; provider.specificationVersion = "v3"; provider.languageModel = createChatModel; provider.embeddingModel = createEmbeddingModel; provider.textEmbeddingModel = createEmbeddingModel; provider.image = createImageModel; provider.imageModel = createImageModel; provider.tools = googleVertexTools; return provider; } // src/google-vertex-provider-node.ts function createVertex2(options = {}) { const apiKey = (0, import_provider_utils5.loadOptionalSetting)({ settingValue: options.apiKey, environmentVariableName: "GOOGLE_VERTEX_API_KEY" }); if (apiKey) { return createVertex(options); } return createVertex({ ...options, headers: async () => ({ Authorization: `Bearer ${await generateAuthToken( options.googleAuthOptions )}`, ...await (0, import_provider_utils5.resolve)(options.headers) }) }); } var vertex = createVertex2(); // Annotate the CommonJS export names for ESM import in node: 0 && (module.exports = { VERSION, createVertex, vertex }); //# sourceMappingURL=index.js.map