📰 DeepSeek-V3.2-Exp官宣发布,API价格下调超50%_《财经》客户端
梁文锋发布了DeepSeek-V3.2-Exp,这是一个实验性版本,旨在优化长文本的训练和推理效率。该版本在V3.1-Terminus的基础上引入了稀疏注意力机制,提升了模型的易用性。官方还开源了TileLang版本的GPU算子,支持更深入的研究和开发。
新版本的API价格大幅降低,输入和输出的费用分别减少了50%以上,极大地降低了开发者的使用成本。DeepSeek-V3.2-Exp在各个领域的基准测试中表现与前一版本相当,显示出其在处理长文本时的高效性。
此外,TileLang编程语言的开发也为算子的实现提供了支持,使得代码量大幅减少,同时保持了性能。与DeepSeek类似,阿里和智谱等公司也在推进大模型的迭代升级,展示了AI领域的快速发展。
🏷️ #DeepSeek #稀疏注意力 #TileLang #API降价 #大模型升级
🔗 原文链接
📰 DeepSeek-V3.2-Exp官宣发布,API价格下调超50%_《财经》客户端
梁文锋发布了DeepSeek-V3.2-Exp,这是一个实验性版本,旨在优化长文本的训练和推理效率。该版本在V3.1-Terminus的基础上引入了稀疏注意力机制,提升了模型的易用性。官方还开源了TileLang版本的GPU算子,支持更深入的研究和开发。
新版本的API价格大幅降低,输入和输出的费用分别减少了50%以上,极大地降低了开发者的使用成本。DeepSeek-V3.2-Exp在各个领域的基准测试中表现与前一版本相当,显示出其在处理长文本时的高效性。
此外,TileLang编程语言的开发也为算子的实现提供了支持,使得代码量大幅减少,同时保持了性能。与DeepSeek类似,阿里和智谱等公司也在推进大模型的迭代升级,展示了AI领域的快速发展。
🏷️ #DeepSeek #稀疏注意力 #TileLang #API降价 #大模型升级
🔗 原文链接