当前位置:首页  媒体华园

羊城晚报:厉害!此技术让机器人在浑浊水下也看得清 |关注全省科技大会

时间:2024-10-22供稿单位:党委宣传部浏览量:127

分享到

羊城晚报10月17日讯(记者 黎秋玲 陈晓楠)10月17日,2023年度广东省科学技术奖公布。best365官网登录入口徐向民教授团队的《基于认知机理与物理规律的视觉计算理论与方法》获广东省自然科学奖一等奖。

项目有何技术创新点和实际应用价值?徐向民向羊城晚报记者进行了介绍。

项目可推动大模型的落地应用

“本项目可以给人工智能模型的发展提供借鉴,推动大模型的落地应用。有诸多创新点。”徐向民对记者表示,人工智能时代,大模型主要依赖数据驱动,但没有刻画视觉物理规律,本项目在视觉计算模型中加入物理规律和认知机理的知识,限定模型优化边界,减少复杂度,同时提升了性能。

例如,针对雾霾等多变环境导致成像质量褪化的现象,项目融入成像物理规律进行建模,让图像从“看不清”变成“看得清”。

另外,海量的视觉数据分布差异巨大且噪声复杂,使得模型对不同环境条件的数据难保持稳定性能。项目基于低复杂度的认知机理,添加低复杂度约束,使海量数据的中层特征从“难算”变得“易算”。

同时,针对图像、视频数据内容复杂,高层语义感知困难的问题,模拟人脑的多通路认知过程,建立高层语义感知模型,使得视觉语义从“难知”变成“可知”。

水下机器人在浑浊水下也看得清的奥秘

视觉计算技术在日常生活中的应用已经非常广泛。

不少市民也对这些应用耳熟能详,例如,视觉增强可以提升拍照效果和恶劣天气下的监控成像效果;无人驾驶技术使用视觉计算来识别道路标志、红绿灯、行人和其他车辆,以确保安全驾驶;以图搜图的检索,让我们可以通过对一个物体拍照来找到购物网站上类似的商品;在医疗领域,视觉计算技术可以辅助医生进行图像诊断,如分析X光、CT和MRI图像,提高诊断的准确性。其中,视觉增强技术除了给人提供好的可视化效果,也能够给其他视觉计算任务提供高质量输入图像以获得更好性能。

项目的视觉增强算法启发了一系列基于深度学习的跟进研究,如图像去雾、去雨、去模糊、去噪、超分、低光增强等,且在相关企业中应用。

谈到具体的应用,徐向民还举例说,水下成像存在模糊问题,影响水下机器人作业。如何解决水下机器人作业时看得清?

“水下成像与大气成像具有相同的传输模型,其主要差别在于空气中雾的大气光为白色,水下成像中环境光为蓝色或蓝绿色。本项目使用的方法是,在环境光估计部分,通过深度模型估算透射率为零点的RGB三通道亮度值,作为环境光成分,同时实现水下成像的去模糊和白平衡。”徐向民表示,该成果使得水下成像看得清,大大提升了水下机器人的可靠性。

视觉计算与人工智能技术未来展望

徐向民介绍,视觉计算有众多应用前景,未来将在人的健康、生活娱乐中发挥更大的作用,如基于表情和动作心理健康状态分析,运动姿态准确性的辅助分析,虚拟现实交互中人体动作分析与内容生成等。

徐向民也是广东省数字孪生人重点实验室的主任。他表示,数字孪生是本项目研究的拓展延伸,在数字孪生的建模过程中,和团队深刻感受到跨领域的合作模式,不仅丰富了研究视角,也为解决复杂科学问题提供了新的思路和方法,体现了学科交叉融合创新的巨大价值。

项目第二完成人贾奎教授将本项目视觉感知技术与具身智能技术相结合,创立了跨维智能,实现通用机器人操作,已为工业、物流和医疗等行业提供了成熟、高性能、便于集成的标准化产品。目前,跨维智能已完成战略轮融资。

展望未来,徐向民就粤港澳大湾区乃至全国人工智能发展提出了个人看法,他建议加强基础研究,加大对人工智能基础理论和算法的研究投入,鼓励原创性研究,以推动人工智能技术的长期发展。其次,要进行跨学科合作,促进人工智能与其他学科如医学、材料、心理学等领域交叉融合,以解决更复杂的问题。第三,建议建立完善的人才培养体系,从基础教育到高等教育,要培养不同层次的人工智能人才,适应各岗位对人工智能人才的需求。建议加强区域间的产学研合作,利用粤港澳大湾区的产业化和商业化优势,加速技术成果的转化。

【项目简介】:为满足高质量发展与现代化生活的视觉数据高效使用需求,视觉处理需解决高质量图像增强、海量数据快速计算、复杂场景视觉分析等问题。但由于复杂模型的参数空间大、大数据带来大计算量、精准感知能力不如人脑,视觉数据的高效率处理挑战巨大。

考虑到物理规律约束可减少优化求解空间,以及人脑的高效率处理数据方式,该项目基于认知机理与物理规律,聚焦视觉计算表征理论、建模方法及核心应用。成果在部分行业龙头公司进行示范应用,助力智能化进程的有效推进。


返回原图
/

Baidu
sogou