在浏览器中使用tensorflow.js进行人脸识别的JavaScript API

2018-07-02 19:46:28 AI科技大本營

作者 | Vincent Mühle

编译 | 姗姗

【导读】随着深度学习方法的应用，浏览器调用人脸识别技术已经得到了更广泛的应用与提升。在实际过程中也具有其特有的优势，通过集成与人脸检测与识别相关的API，通过更为简单的coding就可以实现。今天将为大家介绍一个用于人脸检测、人脸识别和人脸特征检测的 JavaScript API，通过在浏览器中利用 tensorflow.js 进行人脸检测和人脸识别。大家不仅可以更快速学习这个，对有人脸识别技术需求的 JS 开发者来说更是一件值得开心的事。

▌前言

对于 JS 开发者来说这将是一件很开心的事，那就是终于可以在浏览器中进行人脸识别了！通过接下来的这篇文章，将为大家介绍 face-api.js，一个构建在 tensorflow.js core 上的 javascript 模块，实现了人脸检测、人脸识别和人脸特征检测三种 CNNs （卷积神经网络）。

我们将通过研究一个简单的代码示例，只用几行代码就可以试着使用这个包。

▌第一个人脸识别包 face-recognition.js，现在又来了一个包？

如果读过我的另一篇关于人脸识别的文章 Node.js + face-recognition.js : Simple and Robust Face Recognition using Deep Learning，你可能会了解到在不久前，我组装了一个类似的包， face-recognition.js，用 nodejs 来进行人脸识别。

起初，我没有想到在 javascript 社区对人脸识别包的需求会如此之高。对很多人来说，face-recognition.js 就像微软或亚马逊所提供的，似乎是一个不错的可免费使用且开源的替代付费服务的人脸识别服务。但我经常也会被问到一个问题，在浏览器中是或否可以完全运行完整的人脸识别管道。

对此要感谢 tensorflow.js ！我使用 tfjs-core 实现了部分类似的工具，得到与 face-recognition.js 几乎相同的结果，但，是在浏览器中实现的！而最棒的一点是，它不需要设置任何外部依赖关系，就可以直接使用。还有一个意外的奖励 —— 在 WebGL 上运行操作，GPU 的加速。

这足以让我相信，javascript 社区需要这样一个包！这也将留给你们足够的想象空间，你们可以用它来构建各种各样的应用。

▌如何用深度学习解决人脸识别问题

如果你是希望尽快开始，你可以跳过这一部分，直接跳到编码中。但是为了更好地理解 face-api.js 使用的方法。要实现人脸识别，强烈建议参与一起学习，因为我经常会被问到这个问题。

简单来说，我们实际上想要实现的是，识别给出的一个人的面部图像，用作输入图像（input image）。

我们的方法是，给出想识别的那个人的一张或多张图片，并给此人的名字打上标签，用作参考数据（reference data）。现在将输入图片与引用数据进行对比并找出最相似的参考图片。如果两个图像足够相似，我们将会输出此人的名字，否则我们输出结果为 “unknow”。

听起来不错吧！然而这其中还存在两个问题。首先，如果一张照片中有多人并且我们想把所有人都识别出来该怎么办？其次，我们需要能够计算出两张人脸图像的相似度度量，以便比较它们。

▌人脸检测

对于第一个问题的答案是通过人脸检测来解决。简单地说，我们首先定位输入图像中的所有面孔。人脸检测，face-api.js 实现了一个 SSD 算法，它基本上是基于 MobileNetV1 的 CNN，在网络的顶部有一些额外的盒预测层。

网络返回每张面孔的边界框与相应的分数，即显示面孔的每个边界框的概率。这些分数用于筛选边界区域，因为图像中可能根本不包含任何面孔。注意，即使只有一个人要检索边界框，人脸检测也应该执行。

▌人脸特征检测和人脸对齐

第一个问题解决了!但是，我们想要对齐边界框，这样我们就可以在传递给人脸识别网络之前，在每个区域的人脸中心提取出图像，这将使人脸识别更加准确！

为此 face-api.js 实现了一个简单的 CNN 网络，此网络返回给定人脸图像的 68 个点的面部特征。

根据特征点的位置，边界区域可以集中在面部中心。在下图中你可以看到人脸检测的结果（左）与对齐的人脸图像（右）

▌人脸识别

现在我们可以将提取和对齐的人脸图像输入到人脸识别网络中，该网络是基于类似 ResNet-34 的架构，基本上对应于 dlib 中实现的架构。该网络已经被训练学习将人脸的特征映射到人脸描述符（一个有128个值的矢量）中，通常也被称为人脸嵌入。

现在回到比较两个人脸时的原始问题：我们将使用提取的每张人脸图像的描述符，并将它们与参考数据的人脸描述符进行比较。更准确地说，我们可以计算两张人脸描述符之间的欧式距离，根据阈值判断两个人脸是否相似（对于 150×150 幅人脸图像，0.6 是一个很好的阈值）。使用欧几里得距离方法非常有效，当然你也可以选择任意类型的分类器。下面的 gif 图像例子就是通过欧几里得距离来比较的两张人脸图像：

在学过了人脸识别的理论之后，我们开始 coding ~~

▌编码

在这个简短的示例中，我们将逐步看到如何在下面这张多人的输入图像上进行人脸识别：

▌脚本

首先，从 dist / face - api .js上或者 dist/face-ap.min.js 的minifed版本中获取 latest build ，包括脚本：

-->

分享到:

閱讀更多 AI科技大本營 的文章

關鍵字: 人脸识别 GitHub JavaScript

IPFS Desktop是什么如何查看IPFS节点信息

蚂蚁金服Node.js 基础服务

12.17 无需安装，只用一行代码将网页打包成桌面 app

文件分享新玩法-FireFox Send

关于TypeScript ，你知道多少？

2019前端面试经验分享——连拿三大厂offer是一种什么样的体验?

用Node.js把HTML转成PDF格式

Three.JS 粒子系统实现雪花飘落动画花飘落动画

前端14个大厂1周面试题，跳槽稳稳地

Nacos v0.7.0：对接CMDB，实现基于标签的服务发现能力

开源项目哪家强？Github年终开源项目排行出炉

程序员遇见同行博士大牛，感慨自己连个技工都算不上

2017 年崛起的 JS 项目

vue开源项目（pc端项目）资源搜集

WebPack牛刀小试

为什么前后端分离了，你比从前更痛苦？

每日一博丨为什么前后端分离了，你比从前更痛苦？

哪门编程语言更赚钱？看看 Stack Overflow 的最新调查

关于编程，你的练习是不是有效的？

为什么 Java 开发者会对 Node.js 和 JavaScript 如此激动？

百度UEditor控件中的map组件不支持https使用的问题解决

开学福利！2018年9月前端开发者超实用干货大合集

08.21 币圈区块链：茅台镇出品以太坊：一杯敬韭菜！一杯敬自己！

PHP构建这个框架后，开发、运维、性能得到了全面的提升

IPFS大周报第一期 Filecoin Demo首次展示，距离发布越来越近

「Vue.js」一个报错引出的子组件改变父组件属性的思考

神器“金手指”，第6站-抢票软件解析-续（仅供学习）

大前端的技术原理和变迁史

前端、后端和全栈到底都该学什么？

JS防水涂料施工工艺

减少页面加载时间，我是这样进行图像优化的！

Google开源推出Java容器化工具Jib，Java应用可打包成容器映像档

异步社区本周半价电子书

程序员，你的核心竞争力真的是技术吗？

04.16 为什么硅谷所有开发者都是用的Mac，没有人用 NET和Windows吗？

坚持是一种孤独，开发就是这么坑！

阻塞和非阻塞，同步和异步理解

俄罗斯不愧是战斗民族：nginx

学了Python底气足，程序员表示就算睡大街吃垃圾也不搞Java了

当你的信息分享得越多衣服越透明，这件3D打印的衣服你敢不敢穿？

前端资源（仅供参考）

Serverless的微服务架构案例

03.13 大话微服务之服务拆分原则，让你不再为拆分服务而忧愁！

不想当全栈的web前端不是好前端，这些你都会了吗？

H5播放器源码解读 (video.js)

沈巍先生杂谈（358）说好的快手不倒，陪伴到老呢？个个都是戏精

转念一想，这种看似不正常的状态才是正常的，随着时间的推移，很多过去迷迷糊糊的人慢慢就看清了，是进是退跟着内心走就好，别管什么善始善终，不要被这种论调道德绑架，过段时间，你觉得可以，再回来就行，开关在你自己手里，一秒钟就能完成进退。

出海奋斗是有胆识后浪的更优选项

东南亚11国，除去东帝汶，其他10国组成东盟。东南亚有多热，从很多国际资本的快速涌入都有目共睹。养老产业：泰国、越南、菲律宾、马来西亚、印尼都是大受欧美日韩退休人士欢迎的亚洲养老目的地。

甲有5套房，不上班，收房租；乙有1套房，上班赚工资；丙租房子.

每逢佳节被相亲，单身青年看这里！

“非常战疫

为珠峰“量身高”，为啥要人上去？

6日，2020珠峰高程测量行动测量登山队举行出发仪式，30多名计划登顶的测量登山队员当日从海拔5200米的珠峰登山大本营向更高海拔出发，计划抓住近日的天气窗口，择日登顶测量。如果成功，这将成为我国专业测绘人员首次登顶珠峰测高。

我省获国家局通报表扬

湖南名字最尴尬的城市，90%的人都会想歪，当地人：思想有问题！

湖南省作为中国中南地区的一个省份，经济强劲，地位独特，有着十足的发展后劲。湖南经济总量在全国排名第九。湖南也是华夏文明的发祥地，境内的炎帝陵，成为华夏儿女寻根祭祖的重要场所。南岳衡山就在湖南衡阳。湖南张家界景区成为驰名中外的旅游景点。湖南湘西凤凰古镇成为中国驰名十大古镇之一。

超六成前浪点赞《后浪》，全球白手起家90后富豪人均财富190亿

再不来一场精致野餐，我就要被开除中产籍了

《新周刊》创刊于1996年8月18日，由南方出版传媒股份有限公司主管、主办，以“中国最新锐的生活方式周刊”为定位，推出过一系列极具影响力的专题报道，是中国期刊市场最具代表性和影响力的杂志之一，享有“话题策源地”的美誉。

工程师我只服中国，曾经放生到三峡的1万条鱼，如今怎么样了？

每一个大项目其实都会面临一个问题，那就是生态环境，因为所涉及的范围实在太广了，所以需要考虑的问题都是多方面的，三峡就是我国早期的一个超大体量的工程，而三峡所涉及的问题也很多。三峡其实一直都是我国的骄傲，但是关于三峡的质疑声，其实也一点都不少，特别是关于三峡环境方面的质疑声。

后疫情时代的五个营销启示

现象级白酒——李渡高粱酒，作为沉浸式/场景化营销的开创者，早在几年前就使用互联网工具助力，疫情爆发后一系列的操作自然游刃有余了，销量同比增加170%，线上销量更是增加400%。

丘北县双龙营镇人民政府普者黑村委会、矣则村委会太阳能路灯采购安装项目竞争性谈判公告

为什么重量相同的金子，银行卖得比金店还便宜？看完涨知识了

为什么重量相同的金子，银行卖得比金店还便宜？看完涨知识了金子一直是我们中国人比较喜欢投资的一个东西，黄金饰品也是中国女性非常喜欢购买的东西，大家都知道，金子具有保值的功能，所以很多人既喜欢在银行购买金条用于投资，又喜欢去一些金店购买黄金饰品。

打雷的时候，到底要不要拔掉插头，关闭电路呢？看完涨知识了

打雷的时候，到底要不要拔掉插头，关闭电路呢？看完涨知识了大家都会知道，每到夏天，我们的沿海地区都是一个多风多雨的季节，这时候我们出门也是需要随时带上雨具，避免突然有暴风雨这些天气的出现。

乘坐火车时，把车票弄丢了怎么处理？看完可算知道了

乘坐火车时，把车票弄丢了怎么处理？看完可算知道了每次一到假期，就非常害怕到达火车站，可以说是基本上都是人山人海的感觉。很多人会为了方便去选择去乘坐动车和高铁。现在我们无论是出差还是去旅游也都是会选择去坐动车，又快又方便，主要还会很舒服。

肖战视频专访：眼里带着故事，请不要听说他，这一次，请他说

这是肖战春节后，经历过这么多事后首次参加采访。视频中他依然是面带微笑，依旧是少年的样子。但是眼里到这故事，说话也变得小心谨慎，谈吐措辞也是越来越严谨了。

秦山核电应急行动水平优化项目招标公告

从中国电力集采招标网（www.dljczb.

巴基斯坦SK水电站消防及火灾报警系统设备采购招标招标公告

从中国电力集采招标网（www.dljczb.

中煤能源新疆鸿新煤业苇子沟煤矿瓦斯抽采机械设备采购招标公告

从中国电力集采招标网（www.dljczb.

县域社区团购，在平台发展上有哪些优势？

社区团购的迅速发展，已经不再局限于各大城市中的小区。渐渐的扩大范围，发展到一些城市边缘的县城乡镇。像是兴盛优选、十荟团、食享会、考拉精选、美家买菜等月流水上亿的社区团购头部企业，都很重视下沉市场的布局和开拓。

和王为念离婚，与“假奶奶”常香玉对簿公堂，55岁小香玉生活如诗

戏曲是以古代故事以及现代经典故事为题材的艺术表演，也是历史悠久的综合舞台艺术样式，表演戏曲难度很高，但戏曲人才依旧人才辈出，说起在戏曲圈中的佼佼者，陈百玲必是其一。

眼力测试：由4字组成的白菜，1秒看出4个字的智商都很高

这是一幅白菜图，由4字组成的，1秒看出4个字的智商都很高！你看出来了吗？

看图猜字：这个不简单，你能猜对几个？全猜对眼力非凡

这福图上的图你能猜对几个？全猜对眼力非凡，猜对3个眼力160，猜对3个是近视眼！你能猜对几个字？

眼力测试：火焰中藏了4个字，看出3个算达标，全看出眼力200

熊熊火焰中藏了4个字，看出3个算达标，全看出眼力200！你能全部看出来吗？

小米硬刚德国双立人，400年非洲灌木做家用砧板，不发霉砍不坏

民以食为天。

眼力测试：美女图中藏了5个汉字，全部看出来的眼力超群

这幅美女图中藏了5个汉字，你能不能看出来是哪几个汉字呢？全部看出来的眼力超群！

最萌Hodler，刚出生就收到比特币大学教育基金的宝宝

作为比特币爱好者，Izabella的父母在她出生当日于《泰晤士报》刊登了一则附带比特币地址的小广告，希望广大读者能够捐出小部分比特币给他们女儿作为大学教育基金。

《瞭望大湾区》：全国中高风险区域今日“清零”

《晨会解读》：中山证券投资顾问杨立华：连续上涨过后注意把握好操作节奏

孙松峰：幸福生活唱出来

河南市场安全网讯（www.hnscjgw.com）

衡水：守护一湖碧水打造生态之城

长城网衡水讯（记者张梅胜

英国小伙第一次体验中国网吧，就被电脑屏幕吓到直言：这是个啥

网吧其实不管是对于哪个国家的人来说，都是极具吸引力的，而在中国对于八九四年的年轻人和学生来说，网吧简直就是快乐源泉，但是也是老师家长中的眼中钉，肉中刺。相信很多人小时候可能都有过被家长从网吧里揪出来的不甚美好的回忆。

微商到底多能吹牛！哈哈哈哈哈千万别屏蔽，每天都是快乐源泉

虽然有的时候在朋友圈里有很多微商不停的发朋友圈，让大家觉得有些困扰和烦闷，有一种私生活被侵扰的感觉。但是不要忙着屏蔽他们，有的时候这些总是吹得天花乱坠的微商也能给人们带来快乐的源泉。

2020珠峰高程复测出发仪式今日举行小米10全程助力丈量世界新高度

5月6日，2020珠峰高程测量登山队伍出发仪式正式举行，30多名队员当日从海拔5200米的登山大本营向更高海拔出发，开启珠峰冲顶测量。队员们力争抓住近日的天气窗口，择日登顶测量。如果成功，这将是我国专业测绘人员首次登顶珠峰测高。

“十大沂蒙工匠”齐玉祥：钢花璀璨照亮青春之路

一支焊枪、一面防护罩，钢花白昼繁星，在刺耳的噪声中点亮四壁，焊工齐玉祥用13年的青春，打磨出了人生最璀璨的钢花。2007年，齐玉祥毕业后进入山东华源锅炉有限公司工作。刚进公司没多久，由于工作需要，他被分配到了焊接岗位。

日本的丈母娘，卖萌发嗲也是蛮有技术的

国内这点估计是比不过了

消费水平最高的5座城市，北上广深均在列，另一座你知道是哪吗？

我们都知道在地大物博的中国，拥有很多城市，而它们之间的等级划分也都是不同的，等级越高，往往消费就会越高，那么说起国内消费水平最高的几座城市，伙伴们都知道是哪里吗？接下来就让小编带大家去了解一下吧，看看有没有你心中的那个。

德国爱他美怎么样？"断货王"爱他美值得买吗？

哈哈。每次都会用iGepir 姐姐推荐来的，小宝从6个月混养喝起，现在快1岁半了，一直喝爱他美，不上火，购入量大，也算全心全意支持国际妈咪了

广东有望合并的3座城市：合并成功后，将诞生一座千万人口的城市

相信大家都知道，目前广东是中国经济实力最强的城市，哪怕是国内富有的浙江和江苏，在经济上也被广东牢牢按住。你要知道广东可是中国唯一有一线城市的省份，而且还是两座。光靠这一点就能让全国所有的省份羡慕，但比较遗憾的是，广东的经济发展似乎并不平衡。

国外奶粉怎么样？去哪买靠谱？线下实体店一定比网店安全吗？

之前买的一直是国际妈咪的海外仓，但是疫情的缘故怕被吧断粮所以在海外仓直邮了一箱又在自贸仓补了一箱，反正奶粉是消耗品，不担心吃不完hhh。自贸仓物流速递还是很快的，重庆保税区发货，4天到达。

四川潜力大的城市：还是重要的恐龙化石产地，被誉为“恐龙之乡”

对此有的网友说:很多人可能不知道，其实我们自贡还有飞机制造，汽车制造，新能源汽车，及新能源电池研发与制造产业，虽然刚起步，但未来可期!

00后，吾辈当自强

当记者采访她时，她说了一句让人永生难忘的话:“其实我们并不是什么逆行者，只不过是一些普通人在坚守自己的使命。

“我来！”

十天，我应该可以读完一本《百年孤独》，应该可以学会用吉他弹一首歌，还应该可以追完一部电视剧《庆余年》。

东北唯一新一线城市：被誉为“东方鲁尔”，经济却不如省内地级市

众所周知这几年东北的经济，确实没有以前增长得那么快了。原因相信大家也很清楚，简单点说就是南方更适合发展经济。因此中国的经济重心向南移动，所以在未来的几年甚至几十年里面，中国南方的经济都会比北方强。特别是广东省跟浙江省的经济水平，目前已经超越世界上大部分国家了。

人生有尺，做人有度

“救命钱”变“唐僧肉” 扶贫最后一公里处“蝇贪”频现！

家境殷实的90后海归女为何“沉迷”偷快递？

青春洋溢，不加过分修饰，真实的少女感，你喜欢吗？

4名网友预谋绑架一董事长，汇合后剧情突变……

江苏的第二个“苏州”，并非南京和无锡，而是这座低调的城市

说起苏州的大名，相信是无人不知，无人不晓的，作为我国名副其实的最强地级市，苏州近些年属实为人们带来了很大惊喜，甚至在经济发展上也已经远超省会南京，而今天小编要为大家带来的则是江苏境内的“第二个苏州”，发展潜力巨大，并非南京和无锡，而是这座十分低调的城市。

在浏览器中使用tensorflow.js进行人脸识别的JavaScript API

▌前言

▌人脸检测

▌人脸特征检测和人脸对齐

▌人脸识别

▌编码

相關文章:

IPFS Desktop是什么 如何查看IPFS节点信息

蚂蚁金服Node.js 基础服务

12.17 无需安装，只用一行代码将网页打包成桌面 app

文件分享新玩法-FireFox Send

关于TypeScript ， 你知道多少？

2019前端面试经验分享——连拿三大厂offer是一种什么样的体验?

用Node.js把HTML转成PDF格式

Three.JS 粒子系统实现雪花飘落动画花飘落动画

前端14个大厂1周面试题，跳槽稳稳地

Nacos v0.7.0：对接CMDB，实现基于标签的服务发现能力

开源项目哪家强？Github年终开源项目排行出炉

程序员遇见同行博士大牛，感慨自己连个技工都算不上

2017 年崛起的 JS 项目

vue开源项目（pc端项目）资源搜集

WebPack牛刀小试

为什么前后端分离了，你比从前更痛苦？

每日一博丨为什么前后端分离了，你比从前更痛苦？

哪门编程语言更赚钱？看看 Stack Overflow 的最新调查

关于编程，你的练习是不是有效的？

为什么 Java 开发者会对 Node.js 和 JavaScript 如此激动？

百度UEditor控件中的map组件不支持https使用的问题解决

开学福利！2018年9月前端开发者超实用干货大合集

08.21 币圈区块链：茅台镇出品以太坊：一杯敬韭菜！一杯敬自己！

PHP构建这个框架后，开发、运维、性能得到了全面的提升

IPFS大周报第一期 Filecoin Demo首次展示，距离发布越来越近

「Vue.js」一个报错引出的子组件改变父组件属性的思考

神器“金手指”，第6站-抢票软件解析-续（仅供学习）

大前端的技术原理和变迁史

前端、后端和全栈到底都该学什么？

JS防水涂料施工工艺

减少页面加载时间，我是这样进行图像优化的！

Google开源推出Java容器化工具Jib，Java应用可打包成容器映像档

异步社区本周半价电子书

程序员，你的核心竞争力真的是技术吗？

04.16 为什么硅谷所有开发者都是用的Mac，没有人用 NET和Windows吗？

坚持是一种孤独，开发就是这么坑！

​阻塞和非阻塞，同步和异步理解

俄罗斯不愧是战斗民族：nginx

学了Python底气足，程序员表示就算睡大街吃垃圾也不搞Java了

当你的信息分享得越多衣服越透明，这件3D打印的衣服你敢不敢穿？

前端资源（仅供参考）

Serverless的微服务架构案例

03.13 大话微服务之服务拆分原则，让你不再为拆分服务而忧愁！

不想当全栈的web前端不是好前端，这些你都会了吗？

H5播放器源码解读 (video.js)

沈巍先生杂谈（358）说好的快手不倒，陪伴到老呢？个个都是戏精

出海奋斗是有胆识后浪的更优选项

甲有5套房，不上班，收房租；乙有1套房，上班赚工资；丙租房子.

每逢佳节被相亲，单身青年看这里！

为珠峰“量身高”，为啥要人上去？

我省获国家局通报表扬

湖南名字最尴尬的城市，90%的人都会想歪，当地人：思想有问题！

超六成前浪点赞《后浪》，全球白手起家90后富豪人均财富190亿

再不来一场精致野餐，我就要被开除中产籍了

工程师我只服中国，曾经放生到三峡的1万条鱼，如今怎么样了？

后疫情时代的五个营销启示

丘北县双龙营镇人民政府普者黑村委会、矣则村委会太阳能路灯采购安装项目竞争性谈判公告

为什么重量相同的金子，银行卖得比金店还便宜？看完涨知识了

打雷的时候，到底要不要拔掉插头，关闭电路呢？看完涨知识了

乘坐火车时，把车票弄丢了怎么处理？看完可算知道了

肖战视频专访：眼里带着故事，请不要听说他，这一次，请他说

秦山核电应急行动水平优化项目招标公告

巴基斯坦SK水电站消防及火灾报警系统设备采购招标招标公告

中煤能源新疆鸿新煤业苇子沟煤矿瓦斯抽采机械设备采购招标公告

县域社区团购，在平台发展上有哪些优势？

和王为念离婚，与“假奶奶”常香玉对簿公堂，55岁小香玉生活如诗

眼力测试：由4字组成的白菜，1秒看出4个字的智商都很高

看图猜字：这个不简单，你能猜对几个？全猜对眼力非凡

眼力测试：火焰中藏了4个字，看出3个算达标，全看出眼力200

小米硬刚德国双立人，400年非洲灌木做家用砧板，不发霉砍不坏

眼力测试：美女图中藏了5个汉字，全部看出来的眼力超群

最萌Hodler，刚出生就收到比特币大学教育基金的宝宝

《瞭望大湾区》：全国中高风险区域今日“清零”

IPFS Desktop是什么如何查看IPFS节点信息

关于TypeScript ，你知道多少？

阻塞和非阻塞，同步和异步理解

衡水：守护一湖碧水打造生态之城

2020珠峰高程复测出发仪式今日举行小米10全程助力丈量世界新高度