📰 这么哇塞的世界模型,竟然是开源的! – 量子位

蚂蚁灵波开源了通用世界模型 LingBot-World,强调在约十分钟内持续生成与交互。它的视觉效果接近 Genie 3,但时间维度更长,用户可用键鼠实时推进与观察。更难得的是它具备一致性、记忆力与对物理规律的遵循,能在生成世界中自主规划并执行动作,并可通过自然语言改写情境。
在数据层, LingBot-World 采用混合引擎,将真实视频与虚幻引擎合成数据结合,并设计三层描述(叙事、静态场景、密集时序)以解耦背景与动作。训练分三阶段:预训练生成世界、中训练学物理与交互、后训练追求实时性,借助因果注意力与少步蒸馏实现约1秒延迟、16fps。与 LingBot-Depth、LingBot-VLA协同,形成感知、决策、模拟的闭环,且完全开源,为具身智能提供可复用的基础设施。

🏷️ #开源世界模 #具身智能 #实时互动 #记忆能力 #物理一致

🔗 原文链接
 
 
Back to Top