家电品牌工业4.0B2B网站管理系统

扫一扫关注

深研人工智能 服务社会大众——记清华大学电子工程系王生进团队

   2023-09-04 中国网​2920
导读

人工智能(AI),在当今社会中人们不再陌生,2023年,ChatGPT不可谓不火爆,它的出现标志着人工智能技术在自然语言处理和智能对话系统领域的重大进展和突破,让人工智能领域再次成为热门话题,开始受到了全球范围内

 


 

人工智能(AI),在当今社会中人们不再陌生,2023年,ChatGPT不可谓不火爆,它的出现标志着人工智能技术在自然语言处理和智能对话系统领域的重大进展和突破,让人工智能领域再次成为热门话题,开始受到了全球范围内的普遍关注。而在我国人工智能领域,清华大学无疑处于前沿地位,是中国人工智能领域的龙头研究机构之一。

清华大学电子系的王生进教授带领团队,多年从事计算机视觉、机器学习、目标检测与识别、智能视频分析、生物特征识别等方面的研究工作。以目标检测和识别、行人再识别、行为分析为基础,构建了对于国家安全和公共安全有重大需求的智能视频分析系统。近年来,作为负责人主持和参与863计划、国家自然科学基金、国家十三五十四五重点研发计划等多个国家项目,取得了多项创新性的优秀成果,不仅推动了人工智能技术的发展,也为解决实际应用问题提供了有力支持,在我国人工智能领域做出了贡献,践行了把论文写在祖国大地上的初心使命。

致力机器智能 创新人机交互

王生进在国外留学回国后,一直从事人工智能、机器学习和图像处理领域的科研和教学工作,培养了多名优秀博士论文学生,先后参与了10多项国家纵向项目和数十项企业横向项目的研究和开发工作,共获得过一次国家科技进步奖及三次省部奖和一次学会奖,2020-2022连续3年入选“爱思唯尔中国高被引学者”。

王生进作为清华大学电子工程系博士导师、清华大学媒体大数据认知计算研究中心主任、同时作为北京信息科学与技术国家研究中心跨媒体智能创新团队负责人,带领清华AI实验室团队主要研究方向定位为人工智能、计算机视觉和机器学习,具体包括媒体大数据认知计算、跨媒体智能和多模态协作机器人三大方面。

在这其中,多模态融合就是跨媒体智能研究中的一项重要技术,据王生进介绍,多模态指的是多种模态的信息,包括文本、图像、视频、音频等,多模态技术就是将这些不同形式的数据融合在一起进行分析和处理的技术。他表示,要想实现真正的人工智能,让人机交互还原人与人般自然的互动,就需要机器具备视觉、听觉和触觉等强大的感知能力,可以说多模态交互是未来AI技术的一大发展趋势。

近年来,王生进在行人再识别(Person ReID)研究领域取得了多项国际前沿成果。他提出了基于深度网络的特征空间正交优化理论及深度特征学习方法,以解决深度特征冗余的问题;他首次提出一种特征图层配准方法,有效解决了非刚体行人再识别中的特征配准问题;他提出一种融合表观与步态特征的基于选择排序学习的行人再识别方法,有效利用时空信息融合提高了行人再识别性能。该研究成果分别获得了2019年度公安部科学技术奖、2019年度第九届吴文俊人工智能科学技术奖以及2021年度北京市科学技术奖。

在跨媒体智能方面,王生进主要研究面向新一代人工智能的跨媒体数据认知计算,对文字、图像、语音等多种媒体进行统一的协同感知和计算,最终实现获得媒体所承载信息的识别和分析更加准确的结果。经过多年不懈深入研究,不断创新技术,目前他带领团队已经突破了跨媒体信息的高效特征学习和统一语义表达,例如输入一段包含视觉信息、语音信息、字幕信息的视频,智能机器能够把这些信息统一表达出来。相比单一媒体,智能机器利用这三种媒体信息去理解同一事件或内容,提高了信息理解的准确性。以此为基础他带领团队已经研发出了一个喂饭机器人原型,为应对我国老龄化社会来临提供良好的基础支撑。

    

 
(文/小编)
 
反对 0 举报 0 收藏 0 打赏 0 评论 0
0相关评论
免责声明
• 
本文为小编原创作品,作者: 小编。欢迎转载,转载请注明原文出处:https://www.jdpp168.cn/news/show-6164.html 。本文仅代表作者个人观点,本站未对其内容进行核实,请读者仅做参考,如若文中涉及有违公德、触犯法律的内容,一经发现,立即删除,作者需自行承担相应责任。涉及到版权或其他问题,请及时联系我们。