视觉关注计算：北航李甲团队让计算机像人类那样处理图像和视频-e科网

人类每天接收的信息中，有80%来源于视觉系统。视网膜每秒钟可以接收多达100亿比特的信息，但只有大约6亿比特的信息能够进入大脑，而达到大脑高层区域的信息更是少之又少。在此过程中，人类视觉系统能够集中有限的计算资源，优先处理重要的视觉信息。为了使计算机能够像人类那样处理图像和视频，需要首先研究视觉关注计算技术，对图像和视频的重要内容进行预测。

在视觉关注计算的传统研究中，往往通过对人类视觉生理结构进行直接模拟来建模。然而，这些方法仍然存在一定的缺陷。2014年5月，我与北京大学的高文院士合作出版的Springer学术专著从机器学习的角度，对视觉关注计算这一问题进行了全新的阐述。通过对现有视觉关注计算方法进行了系统地调研，我们提出基于大数据和统计学习进行建模将会是视觉关注计算未来最可能的发展方向之一，而这一点也已被该领域的最新研究成果所证实。

在近期的研究中，我们发现在一千万无标注图像上进行简单的统计学习，所得到的视觉关注模型的性能远远超出传统的模型。而通过类似数据驱动的方法，我们能够精确地将图像中的关注物体分割出来，以方便计算机进行后继分析和处理。这两项成果均于近期发表于国际期刊Int’l J. Comput. Vision（计算机视觉领域两大顶级期刊之一），感兴趣的读者可以进一步进行阅读。

李甲个人简介：

北京航空航天大学计算机学院卓越百人副教授，jiali@buaa.edu.cn

博士，副教授（卓越百人），博士生导师，2005年7月于清华大学电子系取得学士学位，2011年1 月于中国科学院计算技术研究所取得博士学位，导师为高文院士。2011年和2013年分别作为博士后和访问助理教授赴新加坡南洋理工大学从事研究工作，并曾于2012年在盛大创新院担任高级研究员，探索科研成果的实际应用。现于北京航空航天大学计算机学院、虚拟现实技术与系统国家重点实验室从事科研与教学工作，兼任中国计算机学会虚拟现实与可视化技术专委会委员，研究领域为计算机视觉、虚拟现实、视频图像处理等。近期主要研究方向包括：数据驱动的视觉关注计算、图像视频场景语义解析等。

目前，主持国家自然科学基金面上项目一项，参与国家自然科学基金重大项目一项。近期在TPAMI、 IJCV、TIP、TCSVT、CVPR等国内外重要学术期刊和学术会议上发表论文20余篇，获国家发明专利授权8项。在Springer出版社出版英文学术专著一部（第一作者）。获2010年度教育部科学技术进步奖一等奖（第9完成人）、2012年度北京市优秀博士学位论文、2012年度中国科学院优秀博士学位论文等荣誉奖励。

[1] Jia Li and Wen Gao, Visual Saliency Computation: A Machine-Learning Perspective. Springer-Verlag. ISBN 9783319056418, 240 pages, May, 2014.

[2] Jia Li*, Yonghong Tian and Tiejun Huang. Visual Saliency with Statistical Priors. Int’l J. Comput. Vision, 107(3), pp.239-253, 2014.

[3] Yonghong Tian, Jia Li*, Shui Yu and Tiejun Huang. Learning Complementary Saliency Priors for Foreground Object Segmentation in Complex Scenes. Int’l J. Comput. Vision, 2014.

（本文整理自北航官网）

如若转载，请注明e科网。

如果你有好文章想发表or科研成果想展示推广，可以联系我们或免费注册拥有自己的主页

北航
视觉关注
人工智能
大数据