类型:系统工具 版本:v 1.3.1
大小:11.73M 更新:2025-08-21
DeepSeek V3.1是一款特别先进的人工智能AI软件。V3.1采用混合推理架构,一个模型同时支持思考模式与非思考模式,具有更高的思考效率。它就像一个拥有两种工作模式的超级大脑,当面对简单问题时,能以非思考模式快速给出答案。而在处理复杂问题时,可切换到思考模式,给出更具深度和逻辑的解答。通过训练优化,新模型在工具使用与智能体任务中的表现有较大提升。以往可能需要等待数秒甚至数十秒才能得到的分析结果,现在转瞬之间便呈现在眼前,大大提升了用户的使用体验和工作效率。
工具调用/智能体支持增强
编程智能体

在代码修复测评 SWE 与命令行终端环境下的复杂任务(Terminal-Bench)测试中,DeepSeek-V3.1 相比之前的 DeepSeek 系列模型有明显提高。
搜索智能体

DeepSeek-V3.1 在多项搜索评测指标上取得了较大提升。在需要多步推理的复杂搜索测试(browsecomp)与多学科专家级难题测试(HLE)上,DeepSeek-V3.1 性能已大幅领先 R1-0528。
思考效率提升
我们的测试结果显示,经过思维链压缩训练后,V3.1-Think 在输出 token 数减少 20%-50% 的情况下,各项任务的平均表现与 R1-0528 持平。

同时,V3.1 在非思考模式下的输出长度也得到了有效控制,相比于 DeepSeek-V3-0324 ,能够在输出长度明显减少的情况下保持相同的模型性能。
API & 模型开源
V3.1的 Base 模型在 V3 的基础上重新做了外扩训练,一共增加训练了 840B tokens。Base 模型与后训练模型均已在 Huggingface 与魔搭开源。
Base 模型:
Hugging Face:
https://huggingface.co/deepseek-ai/DeepSeek-V3.1-Base
魔搭:
https://modelscope.cn/models/deepseek-ai/DeepSeek-V3.1-Base
后训练模型:
Hugging Face:
https://huggingface.co/deepseek-ai/DeepSeek-V3.1
魔搭:
https://modelscope.cn/models/deepseek-ai/DeepSeek-V3.1
需要注意的是,DeepSeek-V3.1 使用了 UE8M0 FP8 Scale 的参数精度。另外,V3.1 对分词器及 chat template 进行了较大调整,与 DeepSeek-V3 存在明显差异。建议有部署需求的用户仔细阅读新版说明文档。
价格调整
我们将于北京时间 2025 年 9 月 6 日凌晨起,对 DeepSeek 开放平台 API 接口调用价格进行如下调整:
执行新版价格表(如下图所示,详见定价页面);
取消夜间时段优惠。

在 9 月 6 日前,所有 API 服务仍按原价格政策计费,您可继续享受当前优惠。
同时,为更好地满足用户的调用需求,我们已进一步扩容 API 服务资源,欢迎使用!
1、混合推理架构
一个模型同时支持思考模式与非思考模式。
2、更高的思考效率
相比 DeepSeek-R1-0528,DeepSeek-V3.1-Think 能在更短时间内给出答案。
3、更强的 Agent 能力
通过 Post-Training 优化,新模型在工具使用与智能体任务中的表现有较大提升。
DeepSeek:专业数据分析与知识挖掘助手
DeepSeek定位为专业场景下的数据分析和知识挖掘工具,专为技术与商业领域设计。
特点与优势:
强大的数据处理和技术文档解析能力。提供深入的知识图谱和报告生成功能。支持多领域的专业知识问答。
适用场景:
适合科研人员、企业决策者和需要深度分析的用户。?
豆包:轻松有趣的社交型助手
豆包定位为一款注重互动性和趣味性的AI助手,非常适合日常聊天和娱乐应用。
特点与优势:
响应快速,语言风格轻松幽默。擅长趣味问答、闲聊和简单信息查询。适合需要轻松交流或快速生成娱乐内容的用户。
适用场景:
适合日常生活中的娱乐需求,如调节心情或进行简单的知识探索。
总体来说,DeepSeek和豆包各有特色,因此,选择哪个更厉害取决于具体的应用场景和需求。
1、采用MoE架构。通过智能选择不同的专家模型进行计算,针对不同的任务激活相应的网络分支,实现计算资源的高效利用。
2、具有优秀的自然语言处理能力,还提供高效的代码编写辅助,满足用户在智能对话和编程支持方面的多样化需求。
3、软件得益于MoE架构和硬盘缓存技术的应用,在处理复杂任务时表现出色,计算效率高,响应快。
1、提供准确流畅的翻译服务,帮助用户轻松融入多语言环境。
2、解决理科难题,提供详细的解题思路和步骤,帮助用户抓住重点,深入理解。
3、用户可以将文献书籍、资料报告等上传给DeepSeek,APP会帮助梳理重点,快速理解。
4、根据指令自动生成创意文案,撰写各类文章和报告,快速构建内容框架,提升工作效率。
5、支持多种编程语言,快速定位问题,生成代码,提升编程效率。
1、调用模型时的并发限制是多少?是否可以提高账号的并发上限?
当前阶段,我们没有按照用户设置硬性并发上限。在系统总负载量较高时,基于系统负载和用户短时历史用量的动态限流模型可能会导致用户收到 503 或 429 错误码。
目前暂不支持针对单个账号提高并发上限,感谢您的理解。
2、为什么我感觉 API 返回比网页端慢
网页端默认使用流式输出(stream=true),即模型每输出一个字符,都会增量地显示在前端。
API 默认使用非流式输出(stream=false),即模型在所有内容输出完后,才会返回给用户。您可以通过开启 API 的 stream 模式来提升交互性。
3、为什么调用 API 时,持续返回空行?
为了保持 TCP 连接不会因超时中断,我们会在请求等待调度过程中,持续返回空行(非流式请求)或 SSE keep-alive 注释(: keep-alive,流式请求)。如果您在自己解析 HTTP 响应,请注意处理这些空行或注释。
4、是否支持 LangChain?
支持。LangChain 支持 OpenAI API 接口,而 DeepSeek API 接口与 OpenAI 兼容。
DeepSeek V3.1在工具使用与智能体任务中的表现有了显著提升。新模型在面对各种复杂的智能体任务时,能够更加灵活、高效地运用工具,完成任务的质量和准确性都有了大幅提高。在智能办公场景中,它可以更好地协同各类办公软件,自动完成文档整理、数据分析等繁琐任务;在智能客服领域,能够更精准地理解用户需求,提供更贴心、高效的服务。
v1.3.1版本
优化了对话体验
多语言支持
新增了模式切换功能,用户可以根据需要选择不同的工作模式,如日常闲聊模式、高效沟通模式等,以满足不同场景下的需求。
《剑侠情缘零》烈羽3V3技能搭配攻略
剑侠情缘零烈羽3V3怎么打?在游戏中3V3主要指的是群英大会和风雪论剑,在这2个玩法中由于是3人一队,所以我们在技能、武学和天赋的选择上面需要注意和队友配合。那么接下来就由乐玩小编给大家带来《剑侠情缘零》烈羽3V3技能搭配攻略吧。
856 2026-03-10 14:53:50
《剑侠情缘零》烈羽1V1技能搭配攻略
剑侠情缘零烈羽1V1怎么打?烈羽是游戏中比较容易上手的职业,兼具单体和群体输出,同时还能切换治疗天赋作为团队辅助上阵。许多新手玩家都爱使用这个职业,那么在1V1场景中烈羽可以使用哪些技能搭配呢?接下来就和乐玩小编一起看看《剑侠情缘零》烈羽1V1技能搭配攻略吧。
579 2026-03-10 14:53:40
《剑与远征启程》渊火龙诗赛季赛季经验购买建议
剑与远征启程渊火龙诗赛季600级之后要不要花钻石买赛季经验?本赛季的一阶段改动很大,所有英雄升级都只需要经验并且不再需要粉尘。所以我们在前期都会花费钻石去购买钻石次数。很多小伙伴好奇一阶段达到600级后是否还需要购买赛季经验,那么有疑问的小伙伴不要错过本篇攻略了。
598 2026-03-10 14:53:38
《挺进地牢手机版》所有模式解锁方法汇总
挺进地牢手机版模式怎么解锁?在游戏中我们除了可以正常游玩外还能开启模式来获得额外的增益或挑战,在开启部分模式的状态下击杀Boss还能获得对应的奖励。那么接下来就和乐玩小编一起看看《挺进地牢手机版》所有模式解锁方法汇总吧。
814 2026-03-10 14:53:26
《剑与远征启程》渔市大亨快速售卖攻略
剑与远征启程渔市大亨怎么快速卖高价?在游戏的渔市大亨活动中我们可以在有限的时间内尽可能卖出多的商品,卖出去的商品可以作为资源返还,由于时间有限制,所以我们需要尽可能的多卖点,那么接下来就由乐玩小编给大家带来《剑与远征启程》渔市大亨快速售卖攻略吧。
953 2026-03-10 14:53:23
8.5分
4463人评价