人工智能之机器学习(ML,machine Learning)浅谈

人工智能之机器学习(ML,machine Learning)浅谈

人工智能在最近两年大出风头,无人驾驶汽车,阿尔法狗战胜人类最强棋手,演唱会人脸识别抓捕逃犯,手机多国语言在线翻译,这一切一切无不给我们带来深深的震撼,可以说人工智能将在不久的未来引来巨大的爆发式增长,对我们每个人的生活带来深刻的影响。

机器学习(ML,machine Learning)是人工智能的一个分支,是让机器自己做主,而不是我们告诉计算机干什么它就干什么,我只告诉计算机,做成什么样子“自己看着办”,计算机你自己需要能学会"察言观色",到时候给我满意的解决方案就OK了。

最早的机器学习定义是Arthur Samuel,在50年代,他编写了一个西洋棋程序,但Samuel却并不是下西洋棋的高手,开始当然这个计算机程序的棋力很差,但这个计算机勤学苦练,从不偷懒,善于学习,于是计算机下着下着,不断的积累经验和吸取教训,最后棋艺竟然超过了Samuel。Arthur Samuel认为,不要使用具体的代码,使用一定的训练数据,使用泛型编程,机器从训练数据中可以学到赢棋的经验,这就是一个机器学习的最初定义。比较严谨一点的机器学习是由卡内基梅隆大学的Tom Mitchell提出的, 一个计算机程序从经验E中学习,解决任务 T,达到 性能P。那个下棋的例子中下很多盘棋就是经验E,下棋就是任务T,P就是这个程序能够赢棋的概率。再举一个例子,我们都是有Email,我们打开Email后会发现除了收件箱之外还有一个垃圾邮件箱,我们打开垃圾邮件箱一看,啊,果然绝大多数都是垃圾邮件,我们很纳闷,邮件服务器是怎么知道那些是正常邮件那些是垃圾邮件?在这个例子中,邮件服务器学习那些是垃圾邮件那些是正常邮件是经验E,把垃圾邮件放入垃圾收件箱是任务T,正确放入垃圾收件箱的概率是P。

有一种计算机算法叫分类算法,无需改动任何代码,可以将输入的不同数据分成不同的种类。如下图所示,第一个算法是输入不同的手写阿拉伯字母,算法可以识别出来1、2、3...9,第二个算法输入邮件信息,它可以分类出垃圾邮件和正常邮件。两个看起起来完全不同的输入,却能完成相同的归类功能。

人工智能之机器学习(ML,machine Learning)浅谈

机器学习主要有两种,监督学习和非监督学习。监督学习就是督促计算机去学习,明确告诉它目标是什么,非监督学习是让计算机“自学成才”,没有设定目标,学习完告诉我你学到了什么。

首先说下监督学习,监督学习是告诉计算机目标,让计算机从训练数据中得到经验,从而对其他问题可以“举一反三”。比如房地产中介要估算一个房子的价格,它需要从不同面积,不同地段,不同价格的数据中学得统计曲线,从而生成一个复杂的计算公式,这样以后再有新的房子信息输入就可以估算出房子的价格。

如下图所示,500平方英尺对应的价格是100K,后续的红叉叉表示已知的价格,计算机学习这些样本,形成一个弧形的曲线函数。以后就用这个函数来估算房产的价格。

人工智能之机器学习(ML,machine Learning)浅谈

再举一个人工智能判断癌症的例子,看下面图片

人工智能之机器学习(ML,machine Learning)浅谈

这个图片的纵坐标是年龄,横坐标是肿瘤大小,蓝色的圆圈是良性肿瘤采样数据,红色的叉叉是恶性肿瘤采样数据,黑色斜线就是良性肿瘤和恶性肿瘤的分界线,如果在下方良性肿瘤的概率很大,如果是上方,恶性肿瘤的概率大。如果判断一个病人的坐标落在红色箭头指的地方,那他是良性肿瘤的概率要大一些。当然这个例子非常简单,仅仅有两个特征变量,年龄和肿瘤大小,实际上可能会有更多的特征变量,比如肿瘤的块厚度,肿瘤细胞的一致性等等。现实的问题可能特征变量会更多。

再介绍下无监督学习,无监督学习没有给计算机目标,只是给出一大堆数据,我不知道这些数据都包括什么,请计算机告诉我这些数据都有哪些,给我分类。

人工智能之机器学习(ML,machine Learning)浅谈

无监督学习可以应用在社交分析中,从中找到那些朋友是常联系的那些是一般的;也可以应用到市场分析,把潜在 客户进行分类。

人工智能之机器学习(ML,machine Learning)浅谈

上图是计算机学得多个人类个体的基因聚类,不同颜色表示不同种类的人类个体,这个在疾病,遗传缺陷等诊断有积极的作用。


分享到:


相關文章: