勇闯前沿领域他让计算机“脑聪目明”-广富强博客

本文转自:科技日报

[奋斗青年说]

◎本报记者吴春新

操作员王笑笑

“当前，新一轮科技革命和产业革命正在发生，与我国高质量发展形成历史性交汇。”7月20日，华中科技大学电子信息与通信学院副教授王兴刚告诉科技日报记者，在高质量发展的道路上奋进，是青年科技工作者的天职。

十余年来，王兴刚围绕目标检测与分割这一世界著名的计算机视觉难题取得新突破，诠释了新时代青年学者的中国自信。

放弃高薪，站上三尺讲台

青春无悔，奋斗无止境。

博士期间，王兴刚获得了2012年亚洲唯一的计算机视觉领域“微软学者”奖。毕业后，他放弃了几家知名互联网公司的高薪，站在三尺讲台上，带领团队勇闯“高效视觉目标识别”的研发难关，为计算机视觉研究创造了更多可能。

计算机视觉是人工智能领域的前沿研究学科，旨在研究如何利用摄像机和计算机获取被摄物体的数据和信息。视觉的应用就像在电脑上安装了“眼睛”和“大脑”。

目前，全球计算机视觉识别研究存在三大问题:深度神经网络模型难以准确、灵活地描述复杂的视觉场景特征；视觉识别模型依靠完善准确的人工标注数据进行训练和学习；该方法计算量大，功耗高，难以在低成本硬件上实时运行。

王兴刚说，他博士毕业的时候，国内这方面的研究刚刚起步，从事计算机视觉基础理论和方法的研究人员还很少。面对这样的情况，他潜心研究，大胆创新，成功“解锁”了计算机视觉识别的巨大潜力。

找到解决难题的新方法

如何解决国内视觉识别发展的问题？走自己的路是关键。

面对国内实验室设备缺乏、团队经费不足、人力严重不足的现状，王兴刚摒弃了国外研究机构大计算力、大模型的研发思路，转而从数据效率和计算效率的角度独辟蹊径。

王兴刚带领团队开发了空之间的稀疏视觉自我注意模型。该模型广泛应用于图像和视频的语义分割、目标检测和其他视觉识别问题。去年，这一成果被《自然》杂志封面文章《蛋白质结构预测人工智能AlphaFold》使用，有效解决了人工智能程序Alpha Fold内存爆炸、计算速度慢等问题。

“我们的第一个快速神经网络自适应机制使得目标分割神经网络架构的搜索速度比Google提出的DPC方法快1700倍。”王兴刚说。

今年4月，王兴刚团队的论文《基于神经结构搜索的高效人体姿态估计》获得《计算机视觉媒体杂志》2021年度最佳论文奖。

“作为一名80后青年科技工作者，我经历了中国科研从弱到强的发展过程和从自信到自信的心路历程。”在王兴刚看来，科研自信是植根于中国的中国科技工作者的自信，是中国科研体制的自信。作为一名中国科技工作者，践行科研，报效国家是我义不容辞的责任。

免责声明：本平台仅供信息发布交流之途，请谨慎判断信息真伪。如遇虚假诈骗信息，请立即举报

勇闯前沿领域他让计算机“脑聪目明”