as22 发表于 2025-3-27 15:44:48

硅基流动SiliconCloud上线加速版DeepSeek-V3-0324

本帖最后由 as22 于 2025-3-27 15:47 编辑

3月27日,硅基流动宣布,硅基流动SiliconCloud平台的Pro版与普通版 DeepSeek-V3现均已完成升级,且同样基于华为云昇腾云部署推理服务。新版本 DeepSeek-V3的价格与API接口保持不变,max_tokens提升至8K,支持Function Calling、JSON Mode、Prefix、FIM。

另外,为确保企业用户平稳过渡至新版本,初始版本V3-1226服务将持续支持一段时间。







据介绍,新版 V3 模型借鉴了 DeepSeek-R1 模型训练过程中所使用的强化学习技术,大幅提高了在推理类任务上的表现。根据 DeepSeek 官方提供的基准测试数据,相比 DeepSeek-V3 初始版本,DeepSeek-V3-0324 的推理能力显著提升:在 MMLU-Pro 上提升了 5.3%,在 GPQA 上提升 9.3%,在 AIME 上提升了 19.8%,在 LiveCodeBench 上提升了 10.0%。




同时,DeepSeek-V3-0324 在以下能力上有所改进:
优化前端开发能力:提高代码生成准确性,可生成更美观的网页和游戏前端。
升级中文写作能力:对齐了 R1 写作风格,中长篇写作质量更高;提升多轮交互式改写能力,优化了翻译质量和书信写作。
提升中文搜索功能:优化报告分析类请求,提供更详实的内容。
改进 Function Calling 能力:提高了函数调用的准确性,修复了 V3 初始版本存在的问题。
据悉,除了最新版 DeepSeek-V3,SiliconCloud 已上架包括 -I2V、Qwen2.5VL-72B、Wan2.1-T2、QwQ-32B、DeepSeek-R1、DeepSeek-R1-Distill、CosyVoice2、DeepSeek-VL2、HunyuaWan2.1nVideo、Qwen2.5-7B/14B/32B/72B、BCE、BGE、SenseVoice-Small在内的上百款模型。其中,DeepSeek-R1 蒸馏版(8B、7B、1.5B)、BGE 等多款大模型 API 免费使用,让开发者实现“Token 自由”。
页: [1]
查看完整版本: 硅基流动SiliconCloud上线加速版DeepSeek-V3-0324