
最大的开源模型。DeepSeek V4 Flash:284B总参数,13B激活参数,同样MoE架构。更小、更快、更便宜,但推理能力在Max模式下几乎追平Pro版本。两个模型都支持100万token上下文,都采用MIT协议完全开源这次更新,还修复了DeepSeek在多轮工具调用中的thinking和replay行为。此前,Agent在连续调用工具、切换会话模型时,容易因为reasoning_cont
当前文章:http://bbcpp.yueduge.cn/8d6/sbe.html
发布时间:02:27:06