IM电竞·(中国)首页

香港城大助理教授殷IM电竞 IM电竞网址鹏:十年如一日致力于“通用机器人”的科研刺头|IM电竞
全国IM电竞服务热线:0510-86179338
产品展示 PRODUCTS
联系我们 CONTACT US
手机:
0510-86179338
电话:
0510-86179338
邮箱:
adminIM@eyoucms.com
地址:
江阴市南闸街道开南路8号
公司动态
当前位置: 首页 > 新闻动态 > 公司动态
香港城大助理教授殷IM电竞 IM电竞网址鹏:十年如一日致力于“通用机器人”的科研刺头
添加时间:2023-09-03

  ——这里是TechBeat人工智能社区为优秀的AI工作者开设的人物专访栏目。从膜拜“红人”到成为“红人”,TechBeat与你一起,在AI进阶之路上,升级打怪、完美通关~

  本篇人物,是来自前卡内基梅隆大学项目科学家、香港城市大学助理教授殷鹏博士。2013年本科毕业于哈尔滨工业大学,2019年博士毕业于中国科学院大学。自2019年至2023年间,他积极参与了备受关注的Darpa SubT Challenge地下机器人挑战赛、NASA火星降落项目,并跟英伟达合作研制首款真实世界的终身定位学习系统。今年秋天,他迎来了职业生涯的新篇章,入职香港城市大学担任助理教授。面对这次从科研者到教授的转变,他将面临怎样的新变化和挑战呢?

  他的研究内容,从学术IM电竞 IM电竞网址圈到产业界吸引到越来越多的同路人。科研工作者,又或是将来进行时的教职身份标签都不能完全符合殷鹏对自己的定义。那么这位“刺头”,在过去的十年到底有着怎样的学术经历呢?以下为采访全文,欢迎阅读~

  从哈工大到中科院再到卡内基梅隆大学,殷鹏成长为一名科研“刺头”,计划之外,却意料之中。敢于挑战机器人小众学术路线上的难题,不断激发自己和周围团队成员的钻研动力,带头在机器人领域搞出自己的名堂,是他一路走来的风格。

  从小学时起,殷鹏就对机器人充满了浓厚的兴趣。但与大家所通常认为的“卷王”不同,殷鹏对社团活动和竞赛无感。他喜欢一个人在图书馆中沉淀,独自思考机器人与人的伦理关系,内心充满着对科学和哲学的追求,以及对未知领域的探索渴望。一个人的时候,他更喜欢反复看那部《攻壳机动队:无罪》,思考通用机器人系统在当下的实现意义。也正是这个原因,他本科选择了哈尔滨工业大学,开始了他的机器人求学之路。

  哈工大毕业之后,他顺利进入了中科院沈阳自动化研究所,继续考虑如何开发通用的机器人系统,但是这个课题不论是在当时还是现在都是一个庞大的课题,即便不包括机器人本体,这个课题涉及的面也包括机器人领域诸如感知、规划、决策、控制、学习、记忆,甚至心理学等一系列问题。因此在顺利达成毕业要求后,他在博士三年级向他的博士导师韩建达教授提出想去CMU看看国际一流的舞台在做些什么。

  因此2017年9月,他来到了匹兹堡,加入了美国知名教授Howie Choset课题组,从此开始了他的美国科研之路。

  2017年9月,殷鹏以访问学者的身份来到CMU,机器人研究所负一楼的地下室就成为了他的第二个家,在这个地方他开始通用机器人的朝圣之路。但是这条路初期却并不顺利,因为即便在CMU,通用机器人这条路也鲜有人尝试过;而在2019年之前,通用机器人技术在多数传统机器人领域还是纸上谈兵,因为缺少真实世界的测试场景。从2019年底左右,殷鹏加入了AirLab课题组,并从此跟着SLAM和规划届传奇人物JiZhang教授和SebastianScherer教授开始他的NASA、DARPA、NVIDIA实战与理论高度绑定的通用机器人之路。

  从2018年开始,NASA提出MARS 2020 Rover提出高精度火星降落的需求,旨在为建立火星基地提供基础层的物资运送保障体系。在跟Ji Zhang教授多次交流后,殷鹏博士和他带的小伙伴开干。在只给定一张卫星地图的前提下,实现了100~150km实时在线定位系统,可以实现在不同天气、不同视角、不同光照下的超长距离定位导航。这项工作也诞生了殷鹏的第一篇IEEE T-RO文章iSimLoc,整个工作于2020年初开始构思,2020年搭建设备+采集数据,2021年反复优化算法和线年发表。本成果也转化为NASA火星降落的参考方案之一;但是对于殷鹏来说更重要的一点在于,这个工作构建了通向通用人工智能的基石:大规模复杂环境中的“定位”。

  从2019年开始,DARPA美国国防高级研究计划局宣布举办为期3年的地下机器人挑战赛(SubT Challenge)。了解DARPA Challenge的同学应该不会对这个机构陌生,2005、2007年的Darpa Ground/Urban Challenge带来了无人驾驶的盛世,而后来的Darpa Robotic Challenge则带来了全世界人形机器人、足式机器人的热潮。而Darpa SubT比赛,主办方将充分考验参赛机器人在多机协作、感知、定位、建模、规划、通信等方面的综合能力,是一项定位于未来火星移民或者抢险救援的通用机器人开发需求。殷鹏博士和他的队友在2019年的挑战赛上获得第一名的好成绩,但是更重要的是,他们开发出了首个超大规模多机协作定位建模系统,这也是他们的第二篇IEEE T-RO工作AutoMerge,这个工作构建了殷鹏心目中通向通用人工智能的基石:大规模复杂环境中的“建模”。

  相关研究成果在IEEE旗舰技术杂志(IEEE Spectrum)和中的报道

  从2021年开始,NASA和NVIDIA同时提出了如何让机器人具备终身学习的需求,因为我们更希望机器人可以在日常的生活中不断迭代自己的行为,像“人类”一样。对于这样的一个问题,殷鹏查阅了大量的心理学和神经科学方面的书籍和论文,参考哺乳动物的记忆系统机制,历时2年半时间开发了首款真实世界的终身定位学习系统,这也是他们2023年的第三篇IEEE T-RO工作BioSLAM。这个工作又进一步补全了殷鹏心目中通用人工智能的拼图:大规模复杂环境中的“终身学习”。

  有人问他如何看待一年内发表多篇TRO这种事情,他的回答很简单,十年沉淀。

  殷鹏一直致力于研究使机器人具备与人类相媲美的定位和导航能力的方法。然而,机器人在实验室环境和真实世界的使用场景之间存在着巨大差距。在真实世界中,机器人在导航探索任务上面临着多重挑战,例如从随机位置开始探索、实现广泛范围的探索、跨时域探IM电竞 IM电竞网址索、构建机器人长期自主性以及多智能体异步探索等。

  殷鹏和团队所做的MetaSLAM框架主要针对于机器人的一种通用人工智能框架。他谈到:“框架充分结合了mapping,localization,navigation,lifelong以及LLM大模型系统。我们进行改进,设计了一种更加大规模的众包地图的方法,这个众包地图的方法使得我们可以把高精度的地图生成通过低成本设备完成,能多次访问、多次重构实现超高精度的重构建模。MetaSLAM框架对推动机器人领域中的导航探索技术的发展起到了积极的推动作用,使机器人能够从过去的经验中学习,快速适应不同环境,并优化其导航能力。同时,它也能够让机器人在未知环境中更好地定位和导航,提高其探索效率和准确性。通过MetaSLAM框架的应用,机器人能够更好地应对实际场景中的导航探索挑战,从而为诸如自主驾驶汽车、无人机和移动机器人(火星车、月球车、地下探测等)等领域带来更具前瞻性和鲁棒性的解决方案。

  在通用机器人中,殷鹏认为SLAM是AGI里面最底层也是最核心的重要环节之一,因为SLAM是构成所有定位系统、感知系统、决策系统、规划系统的基础。目前,3D定位技术主要应用于建图和高精度地图在无人驾驶等领域,以及一些特殊领域,如高精度城市建模、数字孪生和地下环境地貌探索等。场景识别作为SLAM(Simultaneous Localization and Mapping,同时定位与地图构建)技术的一个重要组成部分,在移动机器人和无人驾驶中发挥着关键作用。良好的场景识别能力直接决定了在GPS不稳定环境中的重定位精度。此外,通过场景识别进行的历史数据的累计也可以不断优化感知能力,进一步提升地图精度和规划能力。

  在现实生活中,对SLAM定位导航技术的要求确实越来越高,尤其在无人车定位、无人小车配送和室内外感知规划等领域。虽然目前我们更关注如何在静态环境中提取稳定且高精度的数据,或者通过视觉重构生成地图数据,但这些都与SLAM密切相关。特斯拉的BEV Former是一个例子,它利用数据信息进行预测和感知。它的Ground Choose应用了SLAM方法,并使用类似于Nerve加SLAM的方法进行训练。这种需要更“重感知而轻轻地图”的需求,无疑提高了对SLAM在精度、稳定性和效率方面的要求。在无人驾驶领域中,SLAM技术也面临着新的挑战:如何在低成本的纯视觉情况下构建城市级别和交规级别的地图?

  殷鹏认为,“总的来说,在早期一些SLAM技术中我们更加关注定位和建模精度,但这只是SLAM技术的冰山一角。随着无人驾驶和通用机器人在复杂世界的大规模数据累计,我们更需要开发一种普世的数据关键能力。通过各种元素的关联分析,我们能够获取更深入的信息和洞察力,以推动SLAM技术的进一步发展。”

  如何把机器人赋予人的定位和感知能力?殷鹏团队在这个问题上总结出自己的观点,他们认为只有想清楚了这个问题,才能突破局限,打造出下一代机器人的创新产品。

  在定位方面,建模和定位算法已经相对成熟,可以使室内机器人确定自身在不同房间中的位置。然而,定位的可靠性仍然是一个挑战,因为误差范围的不确定性会影响任务执行的精度要求。室内机器人可能需要毫米级的定位精度,而无人驾驶车辆可能需要更高的厘米级精度。此外,复杂环境中的变化可能导致定位的变化,从而对路径规划和目标搜索等任务产生困难。

  在感知方面,深度学习等技术已经为视觉和语音感知提供了相对成熟的解决方案。当前的感知技术在准确度上表现较好,但仍然存在一些问题。例如,对于简单物体的识别和区分可能存在困难。尽管开源技术已经取得了一定的进展,但仍需要进一步研究和改进,以提高感知系统的性能。

  “从技术角度来看,通用机器人目前面临的最大问题实际上是数据,高质量、自动生成的真实数据。”殷鹏分析道。

  尽管在某些特定领域,比如定位导航建模,单个小模块的表现还不错,甚至只需要简单的传感器就可以实现。但是在面对复杂环境时,机器人需要在室内和室外运动,并适应不同地形,传统算法往往无法提高泛化能力。这意味着我们需要解决适应性泛化的问题。

  另一方面,即使解决了泛化问题,像谷歌的PaLM-E模型,尽管经过长时间的训练,在广泛的环境下仍然无法良好运行。例如,它在一个环境中表现出色的抓取实验,在切换到另一个环境时性能会大幅下降。这是因为大家通常倾向于在特定的小环境中进行机器人任务,导致其识别能力较低。OpenAI的创始人也提到过放弃机器人研究的原因,即在机器人领域中构建大型或具备常识的模型非常困难。

  目前来看,机器人系统中最困难的模块是决策层。定位层和感知层的数据为决策提供了基础,但缺乏准确的空间逻辑关系可能导致决策的不准确性或无法适应特殊情况。特别是在与人类密切互动的场景中,这一问题变得更加显著。比如在无人驾驶领域中,虽然通过降低车速或机器人移动速度可以减轻一些挑战,然而这也让机器与人类的互动变得更加紧密。尤其是对于依赖决策层的实用而高度智能的机器人来说,在真实的室内环境、园区或公路等低速赛道上,问题的复杂性更加显著。如果机器人系统中的上层模块未能有效解决问题,将对人类的安全构成重大威胁。因此,解决这一问题是一项极其复杂的任务,需要仔细考虑与人的互动和安全性。

  2017 年到2023年,殷鹏从访问学者成为卡内基梅隆大学机器人研究所(Robotics Institute)

  Airlab的Project Scientist。Airlab开放而自由的环境让殷鹏能够尽情展示自己的才华。而实验室的领导者Sebastian Schere教授则是一位友善而随和的导师和引路人,他乐于与团队成员交流思想,共同探讨问题的解决方案。Airlab为科研人员提供了广阔的舞台,让他们能够实现个人的价值,追逐内心渴望的目标。

  除此之外,卡内基梅隆大学机器人研究所的“硬核”风格与殷鹏完美契合。研究所注重实际行动,追求实践的成果,注重技术的可行性。在这样的环境中,他能够追求真正的硬核技术,秉持实打实的原则去推动研究,这也是他最心动的一点。

  今年秋季,殷鹏即将迈入香港城市大学,担任助理教授的职位。这一转变是他职业生涯的重要转折,同样也为他注入了全新动力。香港城市大学将成为他实现目标的首要阵地。作为一名助理教授,他将有机会组建自己的研究团队,集中于解决机器人所面临的常识性难题,并探索其在复杂环境中的应用潜力。

  同时,殷鹏将专注于大模型和机器人领域的研究。大模型具有更强大的计算和学习能力,能够处理更复杂的任务,并提供更精确的结果,将成为机器人领域一项重要的发展趋势。

  当聊到殷鹏对科研的态度时,他直言:“通用机器人在当前科研领域依然属于‘小众’方向,并非适合每个人。”从事科研需要内心坚定的决心和对该领域的真挚热爱,这才是追求科研目标所应具备的态度。“如果只是为了获得一纸文凭或追逐高薪而选择科研,那估计行不IM电竞 IM电竞APP 下载通。科研应该源自热爱,与金钱无关,与功利无关。”

  未来的学生画像,殷鹏也在心里打下草稿。“未来计算机领域需要那些在某个领域有卓越表现的‘偏科’生,他们能在自己的专业领域展现出碾压式的领先优势。传统的常识性考试正逐渐被蚕食,现今学习的内容需要结合更多垂直领域信息,才能给计算机人才带来更大的发挥空间。大模型的出现正在取代一些传统的学习方式,因此,具备前瞻性的思维和眼光非常重要。我个人也更偏向这类拥有创新思维和垂直领域知识的‘偏科’学生,而不是来自Top院校或成绩优异的同学。相比来说,我更看重他们的实践经验和突出的领域专长,而非单纯的学科分数。”

  殷鹏,这位对机器人领域不想被标签定义的“刺头”,即将前往更具多元文化冲击的香港。这对于他而言不仅仅是从项目科学家到助理教授的身份转变,更是人生新阶段的起点。殷鹏渴望在这里能够更加深入地感受机器人与人类社会的发展关系,期待看到机械与人文碰撞下,能激发哪些赛博火花。

  Dr. Peng Yin课题组目前正在招收博士研究生、博士后、研究助理,如果你对通用人工智能抱有极大的兴趣,对实体机器人怀有绝对的信念,想在有限的学术生涯做点有趣的事情,你的目标是星辰大海……那么欢迎加入GAIRLAB(盖尔实验室)。

  如果你想和他们一样,亲自来到TechBeat分享,或者想推荐身边闪闪发光但是尚未入驻社区的AI工作者——欢迎填写下方表单自荐/推荐,说不定下一个TechBeat红人荟专访,主角就是你!

  TechBeat是由将门创投建立的AI学习社区()。社区上线+篇技术干货文章,方向覆盖CV/NLP/ML/Robotis等;每月定期举办顶会及其他线上交流活动,不定期举办技术人线下聚会交流活动。我们正在努力成为AI人才喜爱的高质量、知识型交流平台,希望为AI人才打造更专业的服务和体验,加速并陪伴其成长。

  我们会选择部分在深度技术解析及科研心得方向,对用户启发更大的文章,做原创性内容奖励

  或添加工作人员微IM电竞 IM电竞APP 下载信(chemn493)投稿,沟通投稿详情;还可以关注“将门创投”公众号,后台回复“投稿”二字,获得投稿说明。

  TechBeat(隶属于将门创投,是一个荟聚全球华人AI精英的成长社区。

  期待这里可以成为你学习AI前沿知识的高地,分享自己最新工作的沃土,在AI进阶之路上的升级打怪的根据地!

  产品展示 PRODUCTS