科技行者
算力行者
2022年的某一天,中关村管委会找到王田苗教授,希望他能就当时中关村正在推行的标杆孵化器计划,牵头为北京的机器人产业做一些深度服务。
这一年,为加快引导硬科技企业培育能力,北京市科委、中关村管委会重点策划了标杆孵化器建设工作,作为硬科技领域关注度最高的一个产业,机器人自然也在计划之中,而想到机器人,自然也就想到了如今中国机器人领域领军人物王田苗。
王田苗,北京航空航天大学机器人研究所名誉所长,曾任国家863专项机器人专家组组长,他这些年带出的学生,如今不少已经成长为机器人领域翘楚,在国内机器人领域有着极强的号召力。
于是,在北京夏秋交替之际,王田苗与几位科学家、投资人交流并思考如何做这件事儿。
经过几个月的筹备,2022年年底,北京市科学技术委员会、中关村科技园区管理委员会等5部门联合印发了《标杆孵化器培育行动方案(2022-2025年)》,《方案》中指出:
到2025年,力争建成20家标杆孵化器,引领100家现有孵化器升级发展,培育国家高新技术企业2000家、瞪羚企业500家,在海外布局3-5个离岸孵化载体,在京落地海外创新创业人才和项目400个,持续高位引领全国创新创业升级发展。
与此同时,王田苗教授牵头建设的中关村智友标杆孵化器也一并被纳入到这次的培育类标杆孵化器中。
2023年4月7日,在中关村智友研究院主办的tech link智友科学家前沿论坛上,我们聆听了一场关于当下全球热议的仿生机器人技术创新与应用的思想碰撞和深度研讨。
尤其是在王田苗教授对话思灵机器人联合创始人赵悦凯、北京钢铁侠科技有限公司创始人兼ceo张锐、北京因时机器人科技有限公司ceo蔡颖鹏三位年轻机器人创业者的圆桌讨论环节,我们看到了一场关于仿生机器人别开生面的观点碰撞和激烈交锋。
以下为论坛圆桌研讨内容,科技行者进行了不改变原意的整理:
仿生机器人:技术瓶颈和产业机遇
王田苗:你觉得从仿人/仿生前沿技术来看,目前哪几个特别重要的方向值得科学家,甚至大企业去探索?什么方向是未来3-5年能够实现产业化的方向?
赵悦凯:首先要分不同行业来看。如果做成人的形状,我觉得从目前来讲,娱乐行业或者教育行业这种偏娱乐化产业是ok的,可以做得很炫酷,可以做成有手、有腿、有眼,通过编程也可以做一些简单的动作,我觉得这是目前可以商品化的。
但是从医疗、工业领域应用来看,我觉得首先要弄清楚什么是人形机器人?
人形机器人有几个重要特征:你要有眼睛,能看得见,所以视觉识别系统非常重要;你要有触觉,像人一样有感知,这是通过力控来实现的,你有没有四肢或双腿,这个要看你是不是真得需要,在特定领域中,双足是不是真得高效,是否可以用履带替代双腿,或者用其他方式能替代;最重要的是你要有“大脑”,你是不是能真正做到一个很强的ai,看到什么都能理解,能很快地去做决策、做执行,这都离不开你的大脑和操作系统。
从这几个角度来看,我觉得目前工业领域是否需要做成人形还有待讨论,但是一定是需要视觉和触觉,以及很强的ai能力(大脑)和自适应系统。
现在所有像chatgpt这样的ai系统还是从数据中来,到数据中去,还是自然语言模型,真实物理世界中机器人的模型比这要复杂得多,包括一些3d识别系统,你看到之后做决策是不是能拿起来并识别出它是什么,这最终是要靠你有触觉反馈等一系列技术在里面。
坦白来讲,现在这些技术都还是刚刚起步,所以在工业领域想真正做成人形,我觉得路还很漫长,而且需要花大量时间收集数据、处理数据,也需要在硬件上不停迭代升级,这个路程甚至比chatgpt还要漫长很多。
王田苗:特斯拉想在汽车制造中应用仿人机器人,比如在一些特定工位上替代部分工人,你觉得三五年内能实现吗?
赵悦凯:固定几个工位或者类似操作的工序,通过深度学习,不管是视觉学习还是微控的自适应机器人软硬结合算法,这个是ok的。
但是具体也要看应用场景是什么,因为它需要有末端执行工具的开发,其实还是一系列的开发工作。我觉得有些相对固定的、不是完全开放的场景是可以达到的。
从成本上来看,如果是按(官方提到的)2万美元成本来看的话,我相信3-5年能够实现,但是不一定是现在的形态,有可能不是双足的。
王田苗:请张锐谈一下仿人/仿生基础研究哪些方向是未来3-5年的关键方向。
张锐:我个人判断,仿人/仿生机器人目前还有3个主要难题,这也是我们公司不断投入研发的关键方向:
第一,移动机器人能量有限与腿足类机器人瞬间功率要求过大之间的矛盾。
我们现在都在谈如何让机器人动作更快,功率还不能更大。就产品而言,电池的能量是有限的,在这个前提下,功率越大,整机连续工作时间就会越短,机器人连续工作时间太短会直接导致这个机器人没有用途,例如波士顿动力的机器人是全世界动力系统做得最好的机器人,但(早年间)确实没有一款机器人派上用场,这是第一个限制点,限制的不光是人形机器人,还包括所有腿足类机器人。
我们在解决这个问题时也不能盲目追求大功率部件,现在有一些国产部件供应商会给我推一些产品资料,我一看电流很大,但是却没法用,机器人最后连续工作时间太短,会直接导致没有客户为我买单。
第二,目前算法优化上对约束条件考虑的合理性与零部件是否能实现算法要求之间的矛盾。
例如deepmind团队在网上公开了一些仿真视频,整个人形机器人动作非常快,可以跳跃、翻滚,动作非常灵敏,但是在任何一款人形机器人上都无法实现。
这反映出另一个矛盾点是在算法上无约束的条件下,运动模型确实可以做得非常好,但是现实机器人都是靠机械本体来实现的,无论用哪种实现手段,到了部件层面一定会有功率,或者是其他方面的限制因素,会导致整个机器人确实没办法像仿真无约束环境下运动得那么好,我们觉得这个矛盾也是需要全世界仿生机器人不断研究的一个点。
第三,整个仿生机器人数学模型该怎么建立、对应物理实体精准物体数学模型到底要怎么辨识,以及要不要做精准数学模型辨识的问题。
这方面我个人也给不了很好的答案,我只能推动我们公司积极在这一领域探索,因为我们既然是公司来做,首先是会从应用场景出发,最终还是要交付给客户,客户的现实需求会让整个仿生机器人不是只按照基础原理来设计,确实应该有过硬的产品品质,所以会导致整个技术思路和现有学术上的思路略微有一些差异。
王田苗:像波士顿动力的atlas,能够翻滚、跳跃,这样的机器人模型现在是已经攻克了的吗?
张锐:仿生机器人在美国会分为两大主流流派,一个就是以波士顿动力为代表的流派,他们几乎可以单独成为一个流派,本身强调硬件,硬件做得非常好,可以保证物理模型和数学模型完全一致的,也就是规划层是什么样,实际执行层就是什么样,两者之间没有偏差。
但是其它大部分仿人/仿生机器人都做不到物理实体和对应数学模型一样,或者两者之间出现比较大的偏差,这里面本质是存在着一些非线性,而且这些非线性又无法精准辨识出来,也就是在这些团队中,机理问题还没有完全解决。
其它团队采用的方法大都是基于优化、滤波、补偿来辅助实现,因为硬件实现不了,就需要想办法通过算法来辅助实现。
表面上来看,确实产生了算法的多样性,实际上相应的物理实体也确实没有波士顿动力做得那么强。
王田苗:会不会这是大厂玩的项目,小团队玩不动?还是说现在都还是分散式发展,每一块都有机会?
张锐:首先我觉得波士顿动力不属于大厂,但是他们的机器人确实做得非常好,从这个角度来看,仿人/仿生机器人不是只有大厂才能玩。
如果看其他团队,目前来看,全世界比较知名的还有苏黎世联邦理工的团队,只看研发人员的话,他们也不算大团队,所以也不是一个只有大厂可以玩的项目。国内也有做仿人的团队,例如有上市公司也开始入局,如果具体到仿人机器人的项目组或团队,人员也不会很多。
王田苗:你觉得小企业在做仿生/仿人机器人还是完全有机会的吗?
张锐:我觉得要分两个思路来看:
从技术进步的思路来看,无论哪个团队,关键是要有一条技术主线,我不能保证我在仿人/仿生所有机器人相关技术方面都是全面领先的,但是在某一两个点上,要能做到非常优秀,这是所有团队,无论是大厂还是小厂都会关注的。如果只是将其中一两个点做到全球领先程度,小团队也完全可以。
从产品应用角度来看,需要分析客户的本质需求,目前来看,仿人机器人在全世界还没取得特别大的突破,本质上是因为研发团队和客户有一点脱节。
从上世纪六七十年代,国外就已经有团队开始入局人形机器人,但都是单独做技术研发,没有针对某一个场景,尤其没有找到一个客户来提需求,这就导致只是做了几十年的研发而已,对客户一些基本需求都不是特别明白。虽然表面上仿人机器人发展了六七十年,但实际上六七十年的进程和最近二十年的进程,甚至和最近五年的进程也差不多。
这也是为什么最近会有这么多公司,或者说其他领域的团队开始入局人形机器人,本质上是因为人形机器人发展历史虽然很长,但是没有明显突破,这个积累意义到底有多大要值得商榷了。
所以我个人认为,对公司来讲,如果能找到实际客户需求,或者针对客户需求提出一种9479威尼斯的解决方案,虽然在整机各方面性能不是最优,但是我能解决好客户需求,这就已经是好的产品方案了。
王田苗:蔡总,也请你就刚才的这个问题,谈一下自己的看法。
蔡颖鹏:说到仿生机器人,最早出现商业化的应该是电影特效里的道具,例如维塔工作室做的一些道具。后面进入真正商业化时,这种前沿技术商业化路径通常是先进入一些特种行业,然后是工业、医疗行业,再到服务行业,这样一个过程。我认为人形机器人或者仿生机器人也会走这样一个路线。
从机器人进入商用化角度来看,我认为有两个重要的技术方向要突破:第一,移动能力,第二,灵巧操作能力。
我们一直聚焦在机器人上肢上,所以关注点更多是在灵巧操作能力上。其实灵巧操作涉及的层面非常多,包括伺服电机的小型化、高精度,包括力控系统、触觉感知、抓取的知识库,以及各种ai算法。
在chatgpt出现之前,我个人有一个观点是,让机器人完全自主地实现一些工作其实很难,所以我当时设想了一个中间路线——类似于《未来战警》中通过人远程遥控实现机器人控制,同时我能感受到机器人真实的物理反馈。通过这种方式能够作为一个中间状态实现机器人代替人去一些地方,帮人做一些事情,然后再逐步地转移到完全自主控制。
我认为即便是以后智能水平发展得非常高,就像汽车无人驾驶之后,其实还是有很多人愿意自己驾驶汽车,以后的机器人我认为也会是这样,还是会有很多人愿意自己操控机器人,能够真实地感受到物理反馈信号。
再回到您刚才说的特斯拉人形机器人在工厂里的应用情况,因为做这个产品肯定不是为单一场景设计的专用机器人,只有当这个机器人能够实现的功能足够多、完成的任务足够多、通用性足够强,成本才有可能降下来。
以3-5年为周期来看,我认为仿生机器人会是一个在逐步积累操作技能的过程,我相信在期间仿生机器人一定能做一些任务,但以3-5年为周期算仿生机器人的roi的话,肯定是亏本的。只有技能积累到一定量级,成本摊下来,达到的roi才有真正的产业价值。
仿生机器人发展路线:通用or专用?
王田苗:机器人概念提出时,刚好遇上人工智能,人们畅想的是如何做通用机器人,但是走着走着发现有成本、环境、可靠性等问题,于是,慢慢走到了岔路口。首先出现了工业机器人,然后又分出了航天机器人、军用机器人,到后来机器人在医疗、农业等各领域有了分支。这时,仿人机器人依然在被科学家和一些有钱的企业继续探索。在现在这个时间节点上,特斯拉以自己的超级工厂为背景又设想可以批量化推出这样的仿人机器人。
我的问题是,您觉得未来机器人赛道发展,会慢慢集中于以通用机器人为主线去渗透到各个行业,还是会和现在一样,在各个行业分散发展,由客户决定产品形态?
蔡颖鹏:我个人是比较看好归并到几种类型,最终呈规模化发展。这样它的通用性足够强,成本就能做得足够低,随着技术发展,我认为这也是完全有可能实现的。
当然,我认为专用机器人在未来也还是会被保留下来的,但是只是限定在一些特定场景中,大多数的机器人、面向更多应用场景的机器人一定是通用性的,而且会有几个标准形态的。
王田苗:结构上,赵总你觉得会慢慢走向一个相对通用吗?
赵悦凯:我觉得会走向相对通用。基本上,要不然就是机械臂 amr/agv形式,可能再再加上摄像头,要不然就是工业里面中的专用机器人。
如果成本能回收得了,就是专用机器人;如果回收不了,就是机械臂 摄像头 amr/agv的形式,双足是不太可能。
王田苗:张总您怎么看机器人的发展趋势?
张锐:我认为从大的分类上会出现通用化的趋势,但任何一种通用产品都会有很多小的型号,像您提到的轮式机器人,从大类上可以统称为轮式机器人,但是从客户需求和应用场景来看,可能会变成很多种小的型号。
例如一辆车长宽可能会不一样,动力可能会不一样,这个还是会在小型号中有所不同,即便是仿人机器人,士兵和保姆的形态和力量也不一样,即便是仿人通用机器人,在仿人这种具体产品上也会再具体分为几种不同的型号。
王田苗:在仿人/仿生机器人领域,如果分散发展,以客户需求为导向来看的,在未来3-5年,甚至更长一段时间里,我感觉企业形态会出现“多大多小”,但是如果变成一个相对通用的形态的话,我感觉就会发展成为“一大多小”,就不会像中国现在仅仅是整机厂就有二百多家,你认为机器人行业会最终会走向集中吗?
赵悦凯:我的理解,像传统的工业机器人领域有“四大家族”,当然有一些其它机器人厂商发展得也不错,不过基本会向头部集中。
小厂商会遇到很多问题,例如当客户让你研发产品,你没有资金,一般的大企业是不太可能先和你签合同再让你进行研发的,这些公司一定都会遇到资金流等各方面问题。
团队好、产品好的小厂可能在某个时间节点就直接被收购了,因为用户相对是比较集中的,你前期需要为用户花费的资金和时间是巨大的。我们已经用了一百多个亿了,感觉自己还是很穷,因为这个钱要花的地方实在是太多了,你要解决场景也太多了,你要做通用机器人的话,还需要针对更多场景进行开发,后续还有各种工具需要进行研发,视觉上的问题、amr的问题。
所以,最终赛道一定会出现那么几家大厂,小厂很难再生存。
王田苗:按你这么说,所有创新企业都需要加快迭代,加快在通用化过程中找到自己合适的位置,这样才能把自己变成生态链一个关键环节,蔡总,您同意这个观点吗?
蔡颖鹏:我认为仿生机器人是一个非常庞大而复杂的系统,从产业分工角度来说,每一个专项技术一定会有一些小公司做得非常好,这些小公司可能会逐渐在细分领域成长为一些大公司,将来更多是一个生态合作的关系。
王田苗:从国外仿人/仿生机器人研究路线和他们的成果来看,你们觉得有哪些是值得我们借鉴的,有没有一两点启示?
张锐:国外做仿人机器人的团队比较多,但是跟中国不同的是,中国所有研发团队的技术方案都比较趋同,国外每个团队采用的技术方案都各不相同,我觉得这是中国和国外在仿人机器人研究上最大的区别。
如果单纯地看国外仿人机器人各个研发团队,无论从结构设计还是算法设计,每个团队都有自己的长处,也基本上都是会独立去做一些研发。
从这个角度来看,说明两点:
第一,在仿人机器人领域,全世界没有公认的、统一成熟的开发方案,因为不存在成熟的开发方案,所以每个团队都会有很多的机会;
第二,对于所有创新型团队来说,无论是研究院所还是高校,只要找到一个比较好的点,其实都可以在比较短的时间内构建起自己在行业中的地位。
王田苗:蔡总,您怎么看这个问题。
蔡颖鹏:确实刚才张总也说了,国内现在方案会有很多趋同的情况,我个人认为,也有一些背景、一些原因存在,例如核心零部件的供应或者核心零部件自主研发能力可能是制约我们国内机器人团队做不同方案的一个限制因素。
我们现在看到包括波士顿动力或者特斯拉,马斯克自己也说,他们要自己开发更高功率密度、更小体积的执行器,他们会从最底层的执行器开始做创新,这是我们在做机器人过程当中需要去借鉴的地方,这是从底层开始做创新,而不是做集成。
王田苗:赵总从海外视角也为我们解读一下这个问题。
赵悦凯:我们做仿生机器人做了好几十年,实际上除了刚才这些点都是对的以外,还有一个就是你的资金问题,你的钱从哪里来,你的机制是什么样的——是立刻拿了钱立刻就要出成果,成果立刻必须商业化,还是本身就没有一个目的性那么明确、时间那么严苛的节点的项目。
相对来说你的资金充裕,你的研发周期没有要求一定要在某个时间节点达到一个特定的成果,这其实是国外这些团队做得不错的一个重要原因之一。
给创业的科学家几点建议
王田苗:假如高校里的科学家们也想在适当的时候把自己的成果转化,针对这类想参与创业或走出高校自己创业的年轻科学家们,你们能否结合自己这些年创业过程中走过的路,给出一两点中肯的建议?
张锐:在中国大部分行业都会形成少数的巨头优势,但是中国还有另一个现象,我觉得也是中国更为重要的特殊国情,任何一个行业在中国真正火起来的时候会有一个标志性事件——这个行业会涌入不少于100家企业。
目前来看,仿人/仿生机器人领域还不到100家企业,说明这个行业还没有真正火起来,真正火起来的时候一定会有不止100家企业。
为什么会有这么多企业?
以工业机器人为例,虽然表面上会分为几大类,但几百家企业都在做整机,因为每个人都能找到自己的应用领域,会有自己的客户优势,真正做一家公司有技术研发是一方面,能卖出去是更为重要的另一方面,技术和销售双轮驱动对于支撑一个企业成长尤为关键。
我觉得几位科学家在技术上肯定是没问题的,关键问题在于研发的这些产品、积累的这些技术如何转化为订单,如何把这个问题解决好很关键。
赵悦凯:天时、地利得有,大环境就不用多说了,最重要的还有你得有团队。
你的技术要够特别或够领先,同时你的技术也是要能商业化的,你商业化是要有一个合伙人能在商业领域给你很多的帮助和支持,同时你要知道这个企业到底需要什么,因为最终你的产品还是要卖给终端客户,客户的需求对于你的研发是不是够商业化,我觉得也是一个非常重要的点。
蔡颖鹏:借用北航的校训,就是“仰望星空,脚踏实地”。
我们在做着非常前沿的技术时,一定要寻找一些能够商业化落地的路径。例如虽然我们想要做一个非常完美的机器人,但是在这个过程中我们也可以把我们的产品,或者把我们的技术转化到一些其它成熟行业中先应用起来,这样对整个公司商业化或者健康成长都很重要。
我们需要在这个过程中,一步一步地向最长远的目标去努力。
好文章,需要你的鼓励
操作系统有我们看不见的一面,是对计算系统底层资源的管理。但是对于大多数用户而言,操作系统看得见的另一面,则更为重要,它就是——人机交互方式。
大模型要想在人形机器人上发挥出魔力,至少要满足一个基础条件:数学模型与物理模型之间的统一。