杨强:遇见更好的自己

作者 | 王之康

杨强:遇见更好的自己

杨强

人之所以要让自己不断提高、之所以爱学习,就是因为有兴趣,而兴趣的来源则是好奇心,要不断地去问为什么。

他擅长木工,不少朋友家里都放着他做的小家具,比如放杯盘碗盏的架子、放香料的盒子等;他也爱运动,铁人三项比赛中时常能看到他的身影,在10月27日举行的2019成都马拉松中,他还跑出了个人半马的最好成绩——2小时06分;他还是人工智能领域的专家,不久前获得了第九届吴文俊人工智能杰出贡献奖,全国仅有三人获此殊荣。

很难想象,这么多不同领域的标签,却可以同时出现在一个人身上——他就是微众银行首席人工智能官、香港科技大学讲座教授杨强。

说起来,杨强起初是要成为一名物理学家的。至少,他的家庭氛围以及最初的专业选择,显示出了这种迹象。

物理学的根

1978年,作为恢复高考后的首批大学生,杨强进入北京大学地球物理系天体物理专业。之所以选择这个专业,用他自己的话说,“从小受父亲的影响”。

杨强的父亲毕业于清华大学物理系,是一名天体物理学家,后来在北大工作;母亲毕业于北大图书馆系,后来在清华工作。他从小所接触的“朋友圈”,不是研究物理的,就是研究图书馆的。

他对天文学情有独钟,因为从小就和父亲去看望远镜,经常参加父亲的北大讲座,家里也经常有客人来讨论天文学。

“还有一个原因,就是我特别羡慕父亲出差。”杨强告诉《中国科学报》,他父亲当时经常出差做天文观测,每次回来都精神抖擞。

“比如,他每次去云南天文台观测,要坐三天火车,在那儿一待就是一个月,每次回来都会给我讲很多故事,我就觉得他好幸福啊!可是现在发现,出差是个苦差事,这是后话。”

时间一晃,转眼就到了1981年。

当时,CUSPEA项目进行到第三年,已有来自中国科学院、中国科学技术大学、北京大学等高校、院所的19名学生通过该项目去到美国,攻读物理学研究生。

本来,一般只有大四学生才可以参加CUSPEA考试,但CUSPEA允许大三学生通过一个预考进行筛选,其前五名有资格参加考试。

如今回想起来,杨强依然对那次考试记忆犹新。“虽然我大三就参加考试,即使没有通过,也还有机会第二年再考一次,但备考过程还是不敢放松,整个夏天都是在图书馆里度过的。”

那段时间,他每天都处于做题的状态,把以前的题拿来重新做,把物理书后面的所有题都做一遍,同时也找各种各样的物理书来做题。

参加前两届考试的学生凭记忆写下来的考题成为“畅销品”,当时还有一本特别著名的Halliday and Resnick所著的物理书叫Fundamentals of Physics,虽然特别厚,但谁拿到都不肯轻易让给别人,直到从头到尾全背下来才肯罢休。“就像参加第二次高考一样,非常辛苦。”

不过,与笔试相比,更让杨强感到紧张的是面试。

“面试是在北京友谊宾馆进行的,由美国的一些大学教授和他们的夫人来考我们。”杨强说,教授会当面问一些物理问题,他们的夫人则会问一些生活问题。“以前从来没有这样跟外国人对话过,而且当时学的都是英国口音,但他们用的都是美国口音。不过紧张归紧张,所幸后来还是通过了。”

后来,因为面试人中有一位是来自美国马里兰大学做固体物理研究的Anderson教授,所以作为唯一通过考试的大三地球物理系学生的他,后来选择了这所学校,师从做恒星物理学研究的Wentzel教授,继续攻读天体物理学研究生。

循着这样的求学轨迹,杨强将会一步一步成长为物理学家。但事实是,在马里兰大学,他改变了人生航向。

计算机的果

在马里兰大学攻读硕士研究生期间,杨强研究的是太阳物理,主要是通过NASA(美国国家航空和航天局)发射的卫星观察太阳上的一些活动,比如耀斑。

“问题也就随之而来了:耀斑的发生机制是什么?怎样建立一个模型去预测它或解释它?”杨强说,要解决这两个问题,他需要做两件事:一是用物理学的理论建立一个模型,把耀斑爆发的整个过程模拟出来;二是用计算机实现模拟过程。

由于物理学上的研究需要,杨强开始接触计算机,这让他迎来了人生的转折点。

在接触计算机的过程中他发现,首先数据是极端缺乏的。

天体物理需要很多数据都要通过卫星去采集,但卫星有时候发射不了,一等就是几个月,这让他感到“自己的人生掌握在别人的手里”,而计算机却可以通过卫星图像自行产生数据,不用去等。

“其次是计算机真的很有意思。”杨强说,计算机的很多流程都可以自动化,可以用学习的方式来解决。“如果我能成为一个‘码农’的话,就能像上帝一样创造一些东西,掌握自己的实验进程,做各种各样的测试。”

于是,他萌生了转学计算机的想法。

基于自己对计算机产生的浓厚兴趣,杨强就去问计算机系的学生,是否他们也学得如此开心。得到的很多答案却是否定的。

他们整天都在研究数据库、软件工程、计算机语言等,那些都是相对逻辑化、内容比较枯燥的工作。“但有一个分支非常有意思,就是人工智能,试图让机器像人一样做事。”

后来,他去听了几次计算机研讨课,感觉计算机与物理学很像,“但好像比物理学更伟大,因为人类对于人的大脑了解甚少,当时处于一个前沿阶段,做这方面研究的人也很少”。

在后来的导师Dana Nau的办公室门口,他曾看到一张海报,上面写着“Too many lawyers,Too few engineers”(律师太多,而工程师太少)。

之所以这样写,是因为二战后,美国很多有经验的工程师都要退休了,所以当时美国面临大量专业人士缺乏的社会问题,而人们认为解决这个问题的办法,就是用人工智能来顶替人。

当时,正好有一个学生说他导师那儿缺一个人工智能的科研助理,杨强就去面试而且被录用了。

在多种机缘巧合的共同作用下,杨强转到了计算机系。不过几家欢喜几家愁,计算机系向他敞开了大门,但物理学的老师却很不高兴,比如他的导师Wentzel教授。“因为他觉得计算机更像一门技术,物理学才是科学。我觉得他说得不对,而且我的兴趣已经改变了。”

话虽如此,但实际上,他转学计算机早就有因可循了,可以追溯至在北大读书时期。

种子早已埋下

在北大,由于专业需要,杨强时常会做一些天文观测,用计算机分析射电望远镜的频谱,而且这也是他毕业论文的一部分。

“我当时用的计算机是用一台9英寸电视连接一台日本打游戏的主机做成的,第一次学的是BASIC,感觉很有意思,学得废寝忘食。”杨强告诉《中国科学报》,在北大做毕业论文的时候,他听说清华应用数学系老师留美归来后开了一门计算机大课,教计算机语言等,就让他母亲帮忙搞到一个名额。“我记得当时学习特别累,但还是每天利用午休时间跑去听课。人很多,有时候挤都挤不进去,只能踮着脚在人群中露两只眼睛。那时候学生特别好学。”

本科毕业前夕,有一门物理实验课,天体物理专业的学生没有去上,但物理系的学生都上完了,他就向学校老师申请单独去做实验。后来终于做完了,但这个过程却让他感到很无趣。

“我觉得不能一直干这个事,如果一辈子都跟父母做的事情一样,人生岂不是太悲哀了?我要有自己的路、跟他们不一样的路。”他说,人生的路不是一个事件来决定的,如果当时没有去美国,即使在国内,也会转到人工智能。“如果你对一个东西感兴趣,机会是会不断到你跟前来的。”

不过,杨强到了美国之后才知道,转专业这件事到底有多难。

杨强:遇见更好的自己

1987年,杨强(左)和父亲在美国华盛顿。

1984年前后,他对计算机产生兴趣,就一直在用自己时间补课。

正常的计算机课,在学期中间是注册不上的,因为学的人太多,根本没有空余位置,甚至想旁听都没有站的地方。所以,他只能利用夏天的时间选修一些课来恶补。

“我真正开始熬夜就是从那时候开始的。”杨强说,他出国前的视力非常好,但为了赶计算机那些动辄上千行代码的大作业,他不得不经常熬夜,导致视力下降,最终才戴上了眼镜。

让他记忆特别深刻的,是一门叫《操作系统》的课,给学生一台裸机,让他们通过按键的方法,把1和0敲进去,最终实现打印等目的。

“但是那个机器经常坏,有时候敲的是这个键,出的是另外一个字。不过当时情况就是这样,坏的机器也得用,而且是排队用。经常晚上三四点才排到我。”杨强说,上那个课是要脱层皮的,所以大家给它起了个名字,叫Dead Class(死亡课程)。“我从来没见过物理学有那样的课程,晚上教室里灯火通明,学生在外边排着队。”

除此之外,杨强发现马里兰大学还有晚上给成人班上的计算机课,于是他就选了。

后来因为学得好,他还被授课老师选为TA(Teacher Assistant,即教师助理)。有时,那位老师太忙没时间来教课,就让他代课。

在1985年转到计算机系之前,杨强其实已经在教三门计算机课程——数据结构、电路设计、人工智能。也正因此,他后来转学计算机时非常顺利。

做一件伟大的事

说起来,杨强所经历的人工智能要分成前后两个阶段:前半部分是以专家系统为主的思维,即先入为主,人用计算机的逻辑语言把人类的专业知识输入计算机,这是专家系统的模式或者说逻辑推理的形式,也是他读博期间所流行的;后半部分则是机器学习(包括深度学习),即不是先入为主,而是通过对事件和环境的观察、通过训练数据,学到一个模型,再付诸实施,预测未来。

“我读书的时候,后半部分虽然已经开始了,但还没有得到大力发展,因为当时大家觉得那是非主流。”他说,前半部分的专家系统和逻辑推理特别像物理学里的让科学家来建模,虽然物理学积淀所带来的想象力足以让他在建模速度上秒杀计算机系的学生,但也给他带来一定阻碍。“物理学家的先入为主而非观察来反推,是与现在的深度学习模型背道而驰的,所以学物理的学生来学计算机可能会受到影响,我就见过几个学生半途而废了,因为先入为主是他们思维里的一个障碍。”

对于这个障碍,杨强动手做了很多实验,参加了很多比赛,用了很长时间才克服。“比如2005年,我们参加了一个叫ACM KDD CUP(国际知识发现和数据挖掘竞赛)的比赛,动辄给参赛者几百万的数据量,让大家去建模,最后在一个公平的平台上去比赛。像这种比赛,是真正能体现数据思维的。”

在他看来,对于机器学习来说,当有足够数据的时候,模型越复杂越好,因为预测的任务往往跟社会相关,而人的社会关系又是极端复杂的,不可能用一两个简单的公式来描述。

虽然物理世界也是复杂的,但它的目标是用尽量简单的公式来描述,这是两者本质的区别。

大概从在加拿大滑铁卢大学任教开始,杨强1995年得到了终身教授的职位,拥有了相对自由的时间和基金项目支持,便开始了后半部分的研究,即机器学习。

他发现,当时人工智能有一个很小的分支,同时具有机器学习和逻辑推理的特性,即基于例证的推理(Case—based Reasoning),不少哲学家和心理学家也参与其中。

大家发现,人往往可以从一两个例子中推理出道理,然后举一反三。人工智能的研究者就试图去复制这一现象。

“我们希望通过数据来说话,但不足之处在于,在上世纪90年代,数据太少了。”杨强打了个比方,人们总是惊叹于两三岁小孩学语言的能力,实际上,他们并不是基于一两个例子学到的,而是已经有了很多积累,这种积累源于他们出生时,就已经得到了父母赋予的大脑中很多知识的连接,“只不过有些还没有连接上,需要一两个例子来刺激完成”。

其实,这就是杨强后来提出的迁移学习的基本模型,可以把大数据领域的知识迁移到小数据的领域来,解决小数据的问题。

在他看来,机器学习离不开举一反三的能力,即迁移学习;同时也离不开连接数据孤岛的能力,即联邦学习,后者解决的是数据割裂和用户隐私的问题。在大数据时代,只有合作才能看到更多数据,但这种合作不能简单粗暴地进行,而是要兼顾隐私保护。“我们所做的联邦学习,对于隐私保护、数据安全是一个世界性的贡献。”

如今,作为微众银行首席人工智能官,杨强希望把整个金融服务设计到一个人工智能的模型里,这个模型可以自动变成一个银行,然后把这个银行的模型开放给各个行业,让每个行业都有可能自己去做有金融特性的服务。

“我觉得这是特别伟大的一件事,可能需要很多年来做。但每每想起目标的伟大,我都激动得睡不着觉。”杨强说。

让自己跟昨天不一样

从马里兰大学毕业后,杨强曾先后在加拿大滑铁卢大学、西蒙弗雷泽大学、微软亚洲研究院、香港科技大学任教或从事研究,其间曾出任华为诺亚方舟实验室创始主任,还是第四范式公司的联合创始人,并于2018年加入微众银行,建立AI部门。

面对一次次的人生选择,杨强认为自己所遵循的原则其实很简单,就是“不断学习,不断提高自己,让自己跟昨天不一样”。

“在大学工作时,我给自己一个挑战,就是成为行业领袖,知识也要不断提升。”他说,成为Full Professor(正教授)之后还有Chair Professor(讲席教授),再后面还有University Professor(特聘教授),“这些教职都获得之后,我觉得没了目标,周边能学的东西几乎都学到了,所以就要换个‘朋友圈’”。

在他看来,人之所以要让自己不断提高、之所以爱学习,就是因为有兴趣,而兴趣的来源则是好奇心,要不断地去问为什么。

杨强曾带过一名硕士研究生,毕业后将前往美国卡耐基梅隆大学攻读博士,临走前寻求他的建议。学生问完之后告诉他,自己录下了整个对话,如果不让录可以立即删掉,同时他还录了与卡耐基梅隆大学很多著名老师的对话。

杨强没有让他删掉对话录音,而是问了一个问题:“这些人的话有什么共性。”学生告诉他,大家都谈到一点,就是“会问问题和爱问问题比会解问题更重要”。

“实际上,Learning how to learn(学习如何学习)正是机器学习所需要的能力。”杨强说,当然人也需要这个能力,比如儿童教育,教小孩如何有效地去学习,永远都比不过让他对什么都好奇。“一个孩子的好奇心可以通过读书来培养,就像我父亲在我小时候就有意培养我的好奇心,经常拿一些魔幻小说给我讲。”

现在,机器没有好奇心。但杨强希望,以后在这方面多一些探索,实现一个大跨越,不仅让自己,也让机器跟昨天不一样。

CUSPEA即中美联合招考物理研究生项目,是诺贝尔

物理学奖获得者李政道于1979年提出的,此后十年间,这套特殊的留学制度将900多名优秀物理学子送到美国名校求学深造。

40年过去,他们成长为我国乃至国际上科学教育战线及科技创新领域一支非常可观的力量。

2019年是CUSPEA40年,我们有幸采访了部分当年赴美留学的优秀学子,试着用他们不一样的人生故事,来铭记这一段科技教育史上难得的佳话。

并以此向CUSPEA发起人李政道先生,以及所有为该项目顺利实施做出过贡献的人们致敬。

《中国科学报》 (2019-10-30 第5版 学人)


分享到:


相關文章: