1月份以来,Nimbus智能联合创始人兼总裁杨海波在北京人工智能“首届新年大会”和驰远研究院“2026年十大技术趋势”大会上展示了自己的最新成果。之所以如此热潮,是因为嵌入式智能赛道将在2025年爆发式增长,但目前学习数据却缺乏。在此背景下,成立于2023年的光轮智能,作为具身智能背后的“卖水者”脱颖而出。该公司专有的AI模拟合成数据服务恰好填补了这一市场空白。 Nimbus Intelligence目前为国际领先的嵌入式智能团队提供超过80%的模拟和合成数据资产,世界模型团队和多模态模型团队也是该公司的客户。 2026年1月的一个晚上,杨海波与新京报贝壳财经记者进行了一次独家看法。他选择在晚上进行,因为他坚持创业三年以来高强度多工序的工作节奏。每天早上,他都专注于处理来自全球团队的大量信息,他称之为“循环清理”(即删除未回复的微信消息)。此后,我们持续关注重要事项进展,与客户、政府、投资机构密切沟通,平均每天安排四到五次会议。杨海波告诉记者,Nimbus Intelligence创立之初主要针对的是自动驾驶领域,但嵌入式智能普及后,对数据的需求已经变成自动驾驶的至少1000倍。在他看来,只有AI模拟数据才能提供“数据”。未来,机器人和智能实体将广泛应用于各个行业和城市的各个角落,就像今天的手机和汽车一样。他们不可避免地需要可靠数据的支持,下面是贝壳财经记者与杨凯的对话。Nimbus Intelligence 联合创始人兼总裁杨海波先生。大会主办方供图 嵌入式智能卡为何与数据粘在一起?仿真正在成为解决问题的关键 北京壳牌财经报:Nimbus Intelligence 2023 年成立时,要么明确瞄准 AI 仿真和合成数据领域,要么是由于人工智能而逐渐拓展的新业务方向近年来多模态等技术进步? 杨海波:客观地说,公司从第一天起就明确专注于模拟和合成数据轨道,而不是任何特定形式的机器人。在互联网时代,物理世界所需的物理数据和三维数据基本上是空的,这为合成数据创造了重大的发展机会。人工智能要真正走进物理世界,无论是机器人、自动驾驶汽车,还是各类自动化设备,都需要依赖可扩展、可持续、跨场景的数据传输系统。但现实数据在采购过程中普遍面临成本高、效率低、部分场景存在安全风险等问题,难以满足大规模训练需求。现实世界模拟中的高成本、长周期和高风险的试错使得合成成为实现大规模试错和训练的唯一技术路径。因此,仿真并不是跟随行业趋势的后起之秀,而是公司从创立之初就确立的核心技术方向。尽管多式联运方面的改进近年来的能力显着提高了模拟的效率、真实性和视觉表现,但在物理层面,诸如力、接触、变形、材料和摩擦等重要元素仍然需要通过高精度模拟来实现。模拟的主要困难不在于图像是否真实,而在于机制的物理原理。它关系到实际训练中的精度和易用性。这也是与传统或纯视觉模拟相比的本质区别。新京报贝壳财经:合成数据和模拟领域的整体市场结构是怎样的?这个市场还处于蓝海阶段吗?杨海波:2023年我创业的时候,专注于合成数据的公司并不多。当时,业界仍在争论是否使用合成数据。所有实体智能和物理人工智能团队现在都意识到合成数据的重要性以及行业现状讨论的重点是如何正确处理合成数据。我公司进入行业较早,拥有深厚的技术积累。您可以判断合成数据的好坏。关键标准验证过程是客户选择。目前,全球排名前三的建模团队正在使用我们的数据和仿真服务。综合情报团队80%以上的模拟资产和数据来自我们。市场用真实的选择证明了我们的实力。新京报贝壳财经:变现智能化行业火热以来,你们公司的需求与成立时相比增长了多少?杨海波:公司最初的客户集中在自动驾驶等领域。 2024年下半年,全球模型和嵌入式智能的需求将开始显现。最近,具身智能和世界模型领域出现了爆炸式增长。体现英特尔的大脑模型智能源自世界模型,我们更愿意将其理解为在物理世界中实现物理人工智能的关键载体。情报公司的资料要求 1.000 份,主要用于自治。主要有两个原因。首先,自动驾驶本质上是一种“视觉避碰游戏”,不需要复杂的物理交互,而具身智能则需要与世界进行深度交互,比如打开冰箱门时感受磁阻尼的力量,从而增加物理交互的维度。其次,自动驾驶需要现成的数据返回和处理系统,但内置智能是从头开始的,没有标准的数据馈送。还有一个更直观的认识,由于嵌入式智能将取代数千个行业,应用场景比自动驾驶要广泛得多,因此需求数据自然会大幅增加。新京报贝壳财经:你们公司的价格主要是根据定制程度、投入成本还是最终效果来定价?例如,电缆模拟等困难场景是否根据培训成本进行评估?杨海波:合成数据的价格主要以小时价格为主,但具体价格根据场景难度、任务复杂程度、训练规模进行调整。这不是简单的成本定价方法,而是难度和市场情况的结合。当客户将模拟和评估能力纳入其长期研发计划时,他们期望定价方法清晰透明。我们提供的不仅仅是数据档案:我们还提供不断改进的研发能力。值得一提的是,高质量的数据极为罕见。如果是“si el cliente lo tiene o no”,el p请注意,这不是重要的信息,也不是 B 部分的重要信息。让机器人感受到真实的世界。训练模拟数据有哪些难点?新京报 壳牌财经:数据存在困难和技术困难,主要困难是什么?杨海波:训练过程中最核心的挑战是如何生成高质量的数据。这主要体现在两个方面。首先,数据的基本质量必须与物理世界完美匹配。在现实世界的应用中,与现实数据的竞争直接相关的数据,以及与其他玩家之间的互动的机密性,都排除了参与者的市长。其次,由于具体化模型的演变,数据的需求规范将不断变化。这意味着数据提供者不再停留在传统的数据生成或操作层面,而是拥有更好的算法数学理解能力,能够理解数据需求。这需要数据和算法能力。正确处理合成数据需要两个关键功能。首先,我们需要长期的基础技术开发能力来保证高数据质量。同时,我们需要与大客户共同创造,尽量减少0-1阶段模拟与现实世界之间的误差。我们服务过业内最优秀的客户,积累了许多财富。经验是宝贵的。其次,大规模交付能力必须能够通过本体和任务持续不断地生成高质量、大规模的数据。我们不能只追求质量而忽视规模。综合数据的真正衡量标准是质量和规模之间的平衡。这是我们在服务主要客户多年的过程中积累的行业知识。新京报壳牌财经:Nimbus Intelligence拥有多类模拟数据,涵盖医疗场景中的器官、农业场景中的选择任务、工业场景中的有线操作。如何才能实现模拟数据与真实数据的高度一致性?主要技术或技术路径有哪些?杨海波:现实世界中的迭代训练在成本、安全性和效率方面提出了挑战。为此,我们采用了全栈自研的“求解、测量、生成”三合一仿真技术路径。以连接电缆为例。和断开。这是一个全行业的问题。传统模拟将电缆视为简单的弯曲,将插头视为简单的碰撞检测。然而,自动测量工厂不仅可以准确测量电缆的弯曲刚度、扭转特性和重量分布,还可以测量实际的物理参数,例如插入和拔出时的阻力曲线、拔出所需的力、各种角度的锚点和摩擦力等。接触点处的系数。主要存在三个问题。首先,计算复杂。与刚体不同,电缆具有固定的形状。它是一个连续体,理论上具有无限的自由度。为了准确地模拟这一点,您可以将节点离散成数千个节点,其中每个节点都必须与代码交互。这意味着需要实时求解数以万计的方程,耦合非线性方程。传统方法要么不精确,要么计算耗时。二是多物理场耦合。连接和断开电缆并不是一种独特的物理现象。电缆本身是一个具有大变形弹性动力学的柔性体。插头是刚性体,需要精确的接触机构。插入和拔出过程涉及摩擦、卡住和变形。将这些不同的物理学科结合成一个统一的解决方案必须实时解决,这是一个世界级的问题em。三是稳定性和精度之间的平衡。提高精度会呈指数级增加计算量,而追求过高的速度会简化参数并扭曲过程。为了解决上述问题,我们开发了一款内部GPU物理求解器,通过并行GPU加速在物理精度和实时计算之间取得平衡。您不仅可以看到电缆的完整物理状态,还可以在毫秒内完成计算。这些技术能够生成大规模的真实场景,使机器人能够在虚拟环境中真实地体验物理反馈,例如插头弯曲或插入时卡住的感觉,这是机器人训练的迫切需求。相比之下,传统的模拟更像是动画演示,无法实现有效的交互。我们建立的是一个物理级的模拟系统,有数十个每帧背后都有数千个方程,以确保虚拟现实的可靠性。新京报贝壳财经:在当前数据规模扩张的情况下,机器人企业在流程模型训练中能否充分利用仿真数据?杨海波:实体智能的发展需要本体数据的大规模供给,而合成仿真数据是满足这一需求的唯一解决方案。在物理人工智能系统中,模拟数据并不补充真实数据,而是作为训练系统的基础。简而言之,真实数据负责与现实世界保持一致,而模拟数据负责模型增长。我将负责。预训练、强化学习和测试严重依赖模拟数据,这是业界的普遍做法。从供给规模来看,模拟数据的供给量可能比真实数据大两到三个数量级,两者之间不存在可比性。北京新城ws贝壳财经:如果机器人依赖模拟数据进行训练,它会从数据错误中学习吗?例如,数据可能会错位,或者黑客可能会植入恶意指令,导致机器人误判现实。这种风险是真实存在的吗?我该如何面对?杨海波:这其实就是业内所说的“模拟与现实的区别”。这是整个行业面临的挑战,风险也是存在的。例如,如果模拟中的摩擦参数估计太大,则机器人可能会使用较小的力来抓取物体,这可能导致其无法抓取现实世界中的物体。我们的回答主要基于三点。从源头保证数据的真实性。其他公司的模拟参数主要基于假设,而我们通过实际测量获得各种材料和温度的物理参数,并保证测量误差在1%以内,减少了与源头的系统性偏差。在训练过程中引入冲突扰动,例如随机增加或减少物理参数 20%,使模型能够学习处理不确定性,因此机器人学习“原理”而不是记住它们。我们持续与大客户进行互动,他们的实际检测结果就像一份“体检报告”,帮助我们及时发现并解决问题。仿真并不是100%替代真实数据,而是“基于仿真的现实补充”解决方案。 99%的训练是用模拟数据完成的,剩下的1%是用真实数据进行微调,保证效率和安全性。与飞机驾驶训练类似,先进行模拟训练,然后与真实飞行训练相结合。这是模拟的核心。它不是现实的替代品,而是对现实的有效近似。随着机器人规模的扩大,模拟数据变得越来越重要即将到来的关键能力。新京报贝壳财经:未来如果出现同等实力的竞争对手,你们公司追求更高水平是继续开发更复杂的应用场景还是更接近现实世界的物理精度?杨海波:核心是生成多样化、复杂场景的能力。因为我们本质上是在构建一个可以学习的物理世界。这需要三个层面的努力。一是在资产层面实现“可见性、特异性”。这使得零件、工具等在视觉和物理上都足够真实。例如,对于不同材料的夹具或不同硬度的物体,力反馈必须准确。其次,要实现高级场景级重建,必须构建工厂、仓库、住宅等复杂环境来处理动态变化、光线遮挡等情况。例如,需要根据实际情况模拟因窗帘变化而引起的光线变化。最后,要不断提高任务水平,设计各项任务,如装配公差管理、异常情况响应、任务长期多步规划等。面对竞争,本质是在更多样化的场景下实现更高精度的物理交互,提高场景自由度、接触复杂度、稳定性要求。人形机器人的挑战不在于它们的外观,而在于整个身体的身体协调性,这是基于全面的身体信息而多样化的。新京报贝壳财经:您如何看待Nimbus Intelligence本身的发展前景以及整个行业的长期方向?杨海波:如果要用一个词来定义Nimbus Intelligence,那就是“基于仿真技术构建物理人工智能时代的数据基础设施”。如果我们要实施未来规模化的机器人产业,最缺的不是概念,而是可训练、可验证、可复制的数据系统。模拟和基础设施数据。那些能够将其转化为物理的人才能真正支持物理人工智能的实施。这就是我们的定位。在技术层面,我们将继续发展我们的全本地模拟,从自动物理测量、物理属性库和高精度物理解算器到场景和任务的“从实到模拟”的生成能力,我们将不断完善我们的技术平台。在产业层面,物理人工智能一定会从工具阶段走向产业基础阶段。未来,机器人和智能体将像今天的手机和汽车一样,广泛应用于各个行业和城市的各个角落。这背后必然有可靠数据的支撑,而这取决于基于模拟的科学能力。我们希望光轮智能不仅能作为一家公司取得成功,还能为中国在物理人工智能领域的长期竞争贡献一套可复用、可持续进化的基于仿真的核心能力。这是我们的使命。新京报贝壳财经记者罗一丹实习生郭文华主编王金玉编辑刘宝庆