UNPKG

@lobehub/chat

Version:

Lobe Chat - an open-source, high-performance chatbot framework that supports speech synthesis, multimodal, and extensible Function Call plugin system. Supports one-click free deployment of your private ChatGPT/LLM web application.

269 lines (266 loc) 11.3 kB
import { ModelProviderCard } from '@/types/llm'; const PPIO: ModelProviderCard = { chatModels: [ { contextWindowTokens: 64_000, description: 'DeepSeek R1是DeepSeek团队发布的最新开源模型,具备非常强悍的推理性能,尤其在数学、编程和推理任务上达到了与OpenAI的o1模型相当的水平。', displayName: 'DeepSeek: DeepSeek R1 (community)', enabled: true, id: 'deepseek/deepseek-r1/community', pricing: { currency: 'CNY', input: 4, output: 16, }, }, { contextWindowTokens: 64_000, description: 'DeepSeek-V3在推理速度方面实现了比之前模型的重大突破。在开源模型中排名第一,并可与全球最先进的闭源模型相媲美。DeepSeek-V3 采用了多头潜在注意力 (MLA) 和 DeepSeekMoE 架构,这些架构在 DeepSeek-V2 中得到了全面验证。此外,DeepSeek-V3 开创了一种用于负载均衡的辅助无损策略,并设定了多标记预测训练目标以获得更强的性能。', displayName: 'DeepSeek: DeepSeek V3 (community)', enabled: true, id: 'deepseek/deepseek-v3/community', pricing: { currency: 'CNY', input: 1, output: 2, }, }, { contextWindowTokens: 64_000, description: 'DeepSeek R1是DeepSeek团队发布的最新开源模型,具备非常强悍的推理性能,尤其在数学、编程和推理任务上达到了与OpenAI的o1模型相当的水平。', displayName: 'DeepSeek R1', enabled: true, id: 'deepseek/deepseek-r1', pricing: { currency: 'CNY', input: 4, output: 16, }, }, { contextWindowTokens: 64_000, description: 'DeepSeek-V3在推理速度方面实现了比之前模型的重大突破。在开源模型中排名第一,并可与全球最先进的闭源模型相媲美。DeepSeek-V3 采用了多头潜在注意力 (MLA) 和 DeepSeekMoE 架构,这些架构在 DeepSeek-V2 中得到了全面验证。此外,DeepSeek-V3 开创了一种用于负载均衡的辅助无损策略,并设定了多标记预测训练目标以获得更强的性能。', displayName: 'DeepSeek V3', enabled: true, id: 'deepseek/deepseek-v3', pricing: { currency: 'CNY', input: 1, output: 2, }, }, { contextWindowTokens: 32_000, description: 'DeepSeek R1 Distill Llama 70B是基于Llama3.3 70B的大型语言模型,该模型利用DeepSeek R1输出的微调,实现了与大型前沿模型相当的竞争性能。', displayName: 'DeepSeek R1 Distill Llama 70B', enabled: true, id: 'deepseek/deepseek-r1-distill-llama-70b', pricing: { currency: 'CNY', input: 5.8, output: 5.8, }, }, { contextWindowTokens: 64_000, description: 'DeepSeek R1 Distill Qwen 32B 是一种基于 Qwen 2.5 32B 的蒸馏大语言模型,通过使用 DeepSeek R1 的输出进行训练而得。该模型在多个基准测试中超越了 OpenAI 的 o1-mini,取得了密集模型(dense models)的最新技术领先成果(state-of-the-art)。以下是一些基准测试的结果:\nAIME 2024 pass@1: 72.6\nMATH-500 pass@1: 94.3\nCodeForces Rating: 1691\n该模型通过从 DeepSeek R1 的输出中进行微调,展现了与更大规模的前沿模型相当的竞争性能。', displayName: 'DeepSeek: DeepSeek R1 Distill Qwen 32B', enabled: true, id: 'deepseek/deepseek-r1-distill-qwen-32b', pricing: { currency: 'CNY', input: 2.18, output: 2.18, }, }, { contextWindowTokens: 64_000, description: 'DeepSeek R1 Distill Qwen 14B 是一种基于 Qwen 2.5 14B 的蒸馏大语言模型,通过使用 DeepSeek R1 的输出进行训练而得。该模型在多个基准测试中超越了 OpenAI 的 o1-mini,取得了密集模型(dense models)的最新技术领先成果(state-of-the-art)。以下是一些基准测试的结果:\nAIME 2024 pass@1: 69.7\nMATH-500 pass@1: 93.9\nCodeForces Rating: 1481\n该模型通过从 DeepSeek R1 的输出中进行微调,展现了与更大规模的前沿模型相当的竞争性能。', displayName: 'DeepSeek: DeepSeek R1 Distill Qwen 14B', enabled: true, id: 'deepseek/deepseek-r1-distill-qwen-14b', pricing: { currency: 'CNY', input: 1, output: 1, }, }, { contextWindowTokens: 32_000, description: 'DeepSeek R1 Distill Llama 8B 是一种基于 Llama-3.1-8B-Instruct 的蒸馏大语言模型,通过使用 DeepSeek R1 的输出进行训练而得。', displayName: 'DeepSeek: DeepSeek R1 Distill Llama 8B', enabled: true, id: 'deepseek/deepseek-r1-distill-llama-8b', pricing: { currency: 'CNY', input: 0.3, output: 0.3, }, }, { contextWindowTokens: 32_768, description: 'Qwen2.5-72B-Instruct 是阿里云发布的最新大语言模型系列之一。该 72B 模型在编码和数学等领域具有显著改进的能力。该模型还提供了多语言支持,覆盖超过 29 种语言,包括中文、英文等。模型在指令跟随、理解结构化数据以及生成结构化输出(尤其是 JSON)方面都有显著提升。', displayName: 'qwen/qwen-2.5-72b-instruct', enabled: true, id: 'qwen/qwen-2.5-72b-instruct', pricing: { currency: 'CNY', input: 2.75, output: 2.88, }, }, { contextWindowTokens: 32_768, description: 'Qwen2-VL 是 Qwen-VL 模型的最新迭代版本,在视觉理解基准测试中达到了最先进的性能,包括 MathVista、DocVQA、RealWorldQA 和 MTVQA 等。Qwen2-VL 能够理解超过 20 分钟的视频,用于高质量的基于视频的问答、对话和内容创作。它还具备复杂推理和决策能力,可以与移动设备、机器人等集成,基于视觉环境和文本指令进行自动操作。除了英语和中文,Qwen2-VL 现在还支持理解图像中不同语言的文本,包括大多数欧洲语言、日语、韩语、阿拉伯语和越南语等', displayName: 'qwen/qwen-2-vl-72b-instruct', enabled: true, id: 'qwen/qwen-2-vl-72b-instruct', pricing: { currency: 'CNY', input: 4.5, output: 4.5, }, }, { contextWindowTokens: 32_768, description: 'meta-llama/llama-3.2-3b-instruct', displayName: 'meta-llama/llama-3.2-3b-instruct', enabled: true, id: 'meta-llama/llama-3.2-3b-instruct', pricing: { currency: 'CNY', input: 0.216, output: 0.36, }, }, { contextWindowTokens: 32_000, description: 'Qwen2.5-32B-Instruct 是阿里云发布的最新大语言模型系列之一。该 32B 模型在编码和数学等领域具有显著改进的能力。该模型提供了多语言支持,覆盖超过 29 种语言,包括中文、英文等。模型在指令跟随、理解结构化数据以及生成结构化输出(尤其是 JSON)方面都有显著提升。', displayName: 'qwen/qwen2.5-32b-instruct', enabled: true, id: 'qwen/qwen2.5-32b-instruct', pricing: { currency: 'CNY', input: 1.26, output: 1.26, }, }, { contextWindowTokens: 14_336, description: 'Baichuan-13B 百川智能开发的包含 130 亿参数的开源可商用的大规模语言模型,在权威的中文和英文 benchmark 上均取得同尺寸最好的效果', displayName: 'baichuan/baichuan2-13b-chat', enabled: true, id: 'baichuan/baichuan2-13b-chat', pricing: { currency: 'CNY', input: 1.75, output: 1.75, }, }, { contextWindowTokens: 32_768, description: 'Meta最新一代的Llama 3.1模型系列,70B(700亿参数)的指令微调版本针对高质量对话场景进行了优化。在业界评估中,与领先的闭源模型相比,它展现出了强劲的性能。(仅针对企业实名认证通过主体开放)', displayName: 'meta-llama/llama-3.1-70b-instruct', enabled: true, id: 'meta-llama/llama-3.1-70b-instruct', pricing: { currency: 'CNY', input: 2.45, output: 2.82, }, }, { contextWindowTokens: 32_768, description: 'Meta最新一代的Llama 3.1模型系列,8B(80亿参数)的指令微调版本特别快速高效。在业界评估中,表现出强劲的性能,超越了很多领先的闭源模型。(仅针对企业实名认证通过主体开放)', displayName: 'meta-llama/llama-3.1-8b-instruct', enabled: true, id: 'meta-llama/llama-3.1-8b-instruct', pricing: { currency: 'CNY', input: 0.4, output: 0.4, }, }, { contextWindowTokens: 16_384, description: '零一万物,最新开源微调模型,340亿参数,微调支持多种对话场景,高质量训练数据,对齐人类偏好。', displayName: '01-ai/yi-1.5-34b-chat', enabled: true, id: '01-ai/yi-1.5-34b-chat', pricing: { currency: 'CNY', input: 1.1, output: 1.1, }, }, { contextWindowTokens: 16_384, description: '零一万物,最新开源微调模型,90亿参数,微调支持多种对话场景,高质量训练数据,对齐人类偏好。', displayName: '01-ai/yi-1.5-9b-chat', enabled: true, id: '01-ai/yi-1.5-9b-chat', pricing: { currency: 'CNY', input: 0.4, output: 0.4, }, }, { contextWindowTokens: 32_768, description: '智谱AI发布的GLM-4系列最新一代预训练模型的开源版本。', displayName: 'thudm/glm-4-9b-chat', enabled: true, id: 'thudm/glm-4-9b-chat', pricing: { currency: 'CNY', input: 0.5, output: 0.5, }, }, { contextWindowTokens: 32_768, description: 'Qwen2是全新的Qwen大型语言模型系列。Qwen2 7B是一个基于transformer的模型,在语言理解、多语言能力、编程、数学和推理方面表现出色。', displayName: 'qwen/qwen-2-7b-instruct', enabled: true, id: 'qwen/qwen-2-7b-instruct', pricing: { currency: 'CNY', input: 0.32, output: 0.32, }, }, ], // Will be updated with model list checkModel: 'deepseek/deepseek-r1-distill-qwen-32b', description: 'PPIO 派欧云提供稳定、高性价比的开源模型 API 服务,支持 DeepSeek 全系列、Llama、Qwen 等行业领先大模型。', disableBrowserRequest: true, id: 'ppio', modelList: { showModelFetcher: true }, modelsUrl: 'https://ppinfra.com/llm-api?utm_source=github_lobe-chat&utm_medium=github_readme&utm_campaign=link', name: 'PPIO', settings: { disableBrowserRequest: true, sdkType: 'openai', showModelFetcher: true, }, url: 'https://ppinfra.com/user/register?invited_by=RQIMOC&utm_source=github_lobechat', }; export default PPIO;