整座大山都是我的猎场
这条915公里的“绿电高速”完成首次“大体检”_蜘蛛资讯网

eekV4-Pro模型,在8K输入场景,昇腾950超节点可实现TPOT约20ms时单卡Decode吞吐4700TPS。DeepSeek V4-Flash模型,8K长序列输入场景下可实现TPOT约10ms时单卡Decode吞吐1600TPS。基于昇腾A3 64卡超节点结合大EP模式部署,DeepSeek V4-Flash模型,8K/1K输入输出场景,基于vLLM推理引擎可实现2000+TPS的单卡D
当前文章:http://bbcpp.yueduge.cn/zld7ngf/oiq.html
发布时间:14:43:50
