计算机视觉英雄传 第十四回

第十四回 源自印度坎普尔 视觉大师育群英

印度裔在全球科技业中的成功已经毋庸置疑,谷歌掌门皮查伊、微软CEO纳德拉、思科的CTO沃里奥的本科都是毕业于印度理工学院。在印度,印度理工学院(简称IIT)是神一般存在的大学。据说每年有18万经过预选的高中毕业生考生参加IIT的专门考试,只有2%能迈入IIT的大门,不少被IIT拒绝的学生拿到美国麻省理工学院、普林斯顿、加州理工学院等美国名校的奖学金。因此是数亿印度父母与学生的梦想之所系,是英才辈出的世界名校。


计算机视觉英雄传 第十四回

印度理工学院

今天要说的这位计算机视觉大师,就是在印度理工学院坎普尔分校获得电子工程学士学位的Jitendra Malik。Malik生于1960年,1980年本科毕业后留学斯坦福,师从伟大的计算机视觉先驱者之一Thomas O.Binford,并于1985年获得博士学位。1986年,Malik入职加州大学伯克利分校,同时任职于伯克利的计算机科学系、生物工程系和认知与视觉科学团队。2002-2006 期间担任计算机科学系主任。从 2018 年 1 月份开始,他还兼任 Facebook AI Research 的研究主管与现场负责人。Jitendra Malik 带领团队致力于计算机视觉、生物视觉计算建模、计算机图形学和机器学习。


计算机视觉英雄传 第十四回

J.malik

说起Malik,他不但是位印度裔的计算机视觉天才,更是一位桃李满天下的教育家。他的著名弟子包括Jianbo Shi, Paul Debevec, Pietro Perona, Serge J.Belongie, Yair Weiss,甚至他的徒孙想必大家也是非常熟悉,比如李飞飞,一位时长在荧屏上露面的美女科学家,就是Perona的学生、Malik的徒孙。因此李飞飞曾表示 Jitendra Malik 是对她影响最大的三位学者之一。

Malik领导的科研团队曾提出不少著名的计算机视觉概念与算法,如:各向异性扩散(anisotropic diffusion)、归一化切割(normalized cuts),高动态范围成像(high dynamic range imaging)和 R-CNN 等。其中,各向异性扩散,也叫Perona-Malik扩散算法,广泛用于保持图像细节特征的同时减少噪声。这种算法的创新之处是将图像看成物理学的力场或者热流场,图像像素总是向跟他的值相异不是很大的地方流动或者运动,这样那些差异大的地方(边缘)就得以保留,所以本质上各向异性滤波是图像边缘保留滤波器(EPF)。而归一化分割(Ncut)是Malik和他的博士生史建波(Jianbo Shi)提出的一种典型的图论分割算法,成为图像分割领域内最为经典的算法之一,并被广泛地用于数据聚类与图像分割等多个领域。


计算机视觉英雄传 第十四回

P-B扩散的效果

Malik 曾获得 2019 年 IEEE 计算机先驱奖。该奖项一般颁予早期为计算机领域的发展作出过重大贡献的人选,奖项组委会认为 Malik 的贡献在于:通过开拓性研究、领导能力与指导能力,把计算机视觉发展成为一个蓬勃发展的学科。 Malik还获得过两次CVPR 的 Longuet-Higgins 奖和三次 ICCV 的 Helmholtz 奖。此外,他还是 IEEE Fellow、ACM Fellow、美国艺术与科学学院院士、美国国家科学院成员、国家工程院成员,是当之无愧的计算机视觉大师。

从Malik教授身上,我们能够体会到印度人在IT本科教育上的成功,也能体会到Malik卓越的科研领导才能和教育家的高超魅力。向Malik学习致敬!

1.http://www.cs.berkeley.edu/~malik/

2.P.Perona and J. Malik.Scale-Space and Edge Detection Using Anisotropic Diffusion. IEEE Trans. Pattern Anal. Machine Intell, 1990, 12(7):629 -639

3.J. Shi and J. Malik, Normalized Cuts and Image Segmentation, IEEE Trans. Pattern Analysis and Machine Intelligence, vol. 22, no. 8, pp. 888-905, Aug. 2000.


分享到:


相關文章: