echogarden

Version:

An easy-to-use speech toolset. Includes tools for synthesis, recognition, alignment, speech translation, language detection, source separation and more.

github.com/echogarden-project/echogarden

echogarden-project/echogarden

60 lines (39 loc) • 1.8 kB

text/typescript

View Raw

import { RawAudio } from '../audio/AudioUtilities.js' import { wrapEmscriptenModuleHeap } from 'wasm-heap-manager' let sonicInstance: any export async function stretchTimePitch(rawAudio: RawAudio, speed: number, pitchScale: number) { const sampleRate = rawAudio.sampleRate const channelCount = rawAudio.audioChannels.length const inputSamples = rawAudio.audioChannels[0] const inputSampleCount = rawAudio.audioChannels[0].length const m = await getSonicInstance() const wasmHeap = wrapEmscriptenModuleHeap(m) const streamPtr = m._sonicCreateStream(sampleRate, channelCount) m._sonicSetSpeed(streamPtr, speed) m._sonicSetPitch(streamPtr, pitchScale) const inputSamplesRef = wasmHeap.allocFloat32Array(inputSampleCount) inputSamplesRef.view.set(inputSamples) const writeSuccess = m._sonicWriteFloatToStream(streamPtr, inputSamplesRef.address, inputSampleCount) if (writeSuccess != 1) { throw new Error('Sonic error: failed write to stream') } const flushSuccess = m._sonicFlushStream(streamPtr) if (flushSuccess != 1) { throw new Error('Sonic error: failed flushing stream') } const samplesAvailable = m._sonicSamplesAvailable(streamPtr) const outputSamplesRef = wasmHeap.allocFloat32Array(samplesAvailable) const samplesRead = m._sonicReadFloatFromStream(streamPtr, outputSamplesRef.address, outputSamplesRef.allocatedByteCount) const outputSamples = outputSamplesRef.view.slice(0, samplesRead) const resultAudio: RawAudio = { audioChannels: [outputSamples], sampleRate } m._sonicDestroyStream(streamPtr) wasmHeap.freeAll() return resultAudio } async function getSonicInstance() { if (!sonicInstance) { const { default: SonicInitializer } = await import('@echogarden/sonic-wasm') sonicInstance = await SonicInitializer() } return sonicInstance }