📰 DeepSeek开源新模型DeepSeek-OCR,可高效压缩长文本

10月20日,DeepSeek-AI团队发布了名为DeepSeek-OCR的新模型,采用了一种创新的方法来利用视觉模态压缩长文本上下文。该模型的参数量为3B,能够在压缩比低于10倍时实现97%的OCR精度,且单张A100显卡每日可处理超过20万页文档,为长文本处理提供了高效且低成本的解决方案。

在此之前,DeepSeek于9月29日发布了实验性版本DeepSeek-V3.2-Exp,首次实现了细粒度稀疏注意力机制,显著提升了长文本训练和推理的效率。近期,美国《时代周刊》公布了2025年最佳发明榜单,DeepSeek等20余个中国企业的产品成功入选,显示出中国在AI领域的创新能力。

DeepSeek R1高级推理模型的发布被誉为AI领域的“震惊世界第一枪”,在行业基准测试中与OpenAI的产品相媲美。尽管科技巨头们在生成式AI项目上投入巨资,DeepSeek却以仅600万美元的训练成本和极低的算力消耗,迅速崛起并向用户免费开放,展现了其强大的竞争力。

🏷️ #DeepSeek #OCR #长文本 #稀疏注意力 #AI创新

🔗 原文链接

📰 DeepSeek-V3.2-Exp官宣发布,API价格下调超50%_《财经》客户端

梁文锋发布了DeepSeek-V3.2-Exp,这是一个实验性版本,旨在优化长文本的训练和推理效率。该版本在V3.1-Terminus的基础上引入了稀疏注意力机制,提升了模型的易用性。官方还开源了TileLang版本的GPU算子,支持更深入的研究和开发。

新版本的API价格大幅降低,输入和输出的费用分别减少了50%以上,极大地降低了开发者的使用成本。DeepSeek-V3.2-Exp在各个领域的基准测试中表现与前一版本相当,显示出其在处理长文本时的高效性。

此外,TileLang编程语言的开发也为算子的实现提供了支持,使得代码量大幅减少,同时保持了性能。与DeepSeek类似,阿里和智谱等公司也在推进大模型的迭代升级,展示了AI领域的快速发展。

🏷️ #DeepSeek #稀疏注意力 #TileLang #API降价 #大模型升级

🔗 原文链接

📰 iPhone 17 / Pro 系列正式发售;英伟达向英特尔投资 50 亿美元;DeepSeek 登《自然》杂志封面|Do早报- DoNews

苹果于9月19日正式发售iPhone 17 / Pro系列手机,标准版配备A19芯片,并升级至支持120Hz的显示屏;Pro版则搭载A19 Pro芯片,采用全新的横向大矩阵摄像头设计,展现出强大的拍照能力,吸引了众多消费者的关注。

同时,英伟达宣布向英特尔投资50亿美元,以每股23.28美元的价格购买其普通股,低于英特尔的收盘价。这一投资将进一步加深两家公司在技术领域的合作,促进创新与发展。

此外,华为在全联接大会上公布了昇腾950芯片架构,提升了算力和支持低精度数据格式。追觅科技CEO俞浩则在内部讲话中透露,计划在2027年推出对标布加迪威龙的高端汽车,手机业务也将向华为和小米发起挑战。DeepSeek团队的研究论文更是登上了《自然》杂志的封面,标志着其在科研领域的成就。

🏷️ #iPhone #英伟达 #华为 #追觅 #DeepSeek

🔗 原文链接
 
 
Back to Top