ai-functions

/** * Tests for embeddingCacheMiddleware — embedding-side analogue of * cacheMiddleware for `wrapEmbeddingModel`. */ import { describe, it, expect, beforeEach, afterEach } from 'vitest' import { wrapEmbeddingModel } from 'ai' import { MockEmbeddingModelV3 } from 'ai/test' import { embeddingCacheMiddleware } from '../src/index.js' describe('embeddingCacheMiddleware', () => { const originalGate = process.env['V3_EVAL_CACHE'] beforeEach(() => { process.env['V3_EVAL_CACHE'] = '1' }) afterEach(() => { if (originalGate === undefined) { delete process.env['V3_EVAL_CACHE'] } else { process.env['V3_EVAL_CACHE'] = originalGate } }) it('returns cached embeddings on second call with same values', async () => { let callCount = 0 const upstream = new MockEmbeddingModelV3({ modelId: 'test-embed', doEmbed: async () => { callCount++ return { embeddings: [ [0.1, 0.2, 0.3], [0.4, 0.5, 0.6], ], } }, }) const wrapped = wrapEmbeddingModel({ model: upstream, middleware: embeddingCacheMiddleware({ enabled: true }), }) const r1 = await wrapped.doEmbed({ values: ['a', 'b'] }) expect(r1.embeddings).toEqual([ [0.1, 0.2, 0.3], [0.4, 0.5, 0.6], ]) expect(callCount).toBe(1) const r2 = await wrapped.doEmbed({ values: ['a', 'b'] }) expect(r2.embeddings).toEqual([ [0.1, 0.2, 0.3], [0.4, 0.5, 0.6], ]) expect(callCount).toBe(1) // cache hit — no second upstream call }) it('treats different value batches as separate keys', async () => { let callCount = 0 const upstream = new MockEmbeddingModelV3({ modelId: 'test-embed', doEmbed: async ({ values }) => { callCount++ return { embeddings: values.map((_, i) => [i, i + 1]), } }, }) const wrapped = wrapEmbeddingModel({ model: upstream, middleware: embeddingCacheMiddleware({ enabled: true }), }) await wrapped.doEmbed({ values: ['a'] }) await wrapped.doEmbed({ values: ['b'] }) expect(callCount).toBe(2) }) it('falls through to upstream when env gate is unset', async () => { delete process.env['V3_EVAL_CACHE'] let callCount = 0 const upstream = new MockEmbeddingModelV3({ modelId: 'test-embed', doEmbed: async () => { callCount++ return { embeddings: [[1, 2, 3]] } }, }) const wrapped = wrapEmbeddingModel({ model: upstream, middleware: embeddingCacheMiddleware(), }) await wrapped.doEmbed({ values: ['x'] }) await wrapped.doEmbed({ values: ['x'] }) expect(callCount).toBe(2) // no caching when gate is off }) it('respects explicit enabled: false override', async () => { let callCount = 0 const upstream = new MockEmbeddingModelV3({ modelId: 'test-embed', doEmbed: async () => { callCount++ return { embeddings: [[1, 2, 3]] } }, }) const wrapped = wrapEmbeddingModel({ model: upstream, middleware: embeddingCacheMiddleware({ enabled: false }), }) await wrapped.doEmbed({ values: ['x'] }) await wrapped.doEmbed({ values: ['x'] }) expect(callCount).toBe(2) }) it('evicts entries past TTL and re-fetches', async () => { let callCount = 0 const upstream = new MockEmbeddingModelV3({ modelId: 'test-embed', doEmbed: async () => { callCount++ return { embeddings: [[callCount]] } }, }) const wrapped = wrapEmbeddingModel({ model: upstream, middleware: embeddingCacheMiddleware({ enabled: true, ttlMs: -1 }), // TTL = -1 → every entry is "older than -1 ms" → always evicted on access }) await wrapped.doEmbed({ values: ['x'] }) await wrapped.doEmbed({ values: ['x'] }) expect(callCount).toBe(2) // TTL expired, re-fetch }) })