用AI来识别假新闻，如何做到？"知己知彼，百战不殆"

2019-06-21 13:25:09 安東的日常

当今媒体最大的问题之一就是所谓的"假新闻"，它之所以如此有害，部分原因在于它看起来太像真的了。人工智能工具有望帮助识别假新闻，但为了让人工智能识别假新闻，研究人员发现，最好的办法是让人工智能学会自己创造假新闻——虽然它可能没有听起来那么危险，不过这确实是一把双刃剑。

格罗弗(Grover)是由华盛顿大学和艾伦人工智能研究所的计算机科学家们合作创建的一个新系统，该系统非常善于就无数话题和不同风格撰写令人信服的假新闻ーー其直接结果是，它在发现假新闻方面也毫不逊色。

假新闻生成器的想法并不新鲜——OpenAI前段时间引发了热议，因为他宣布其自行生成的人工智能过于危险，不能公开发布。但是格罗弗的创造者认为，我们只有把制造假新闻的工具放在那里进行研究，才能更好地打击假新闻。

"我们现在认为，这些模式没有能力造成严重伤害。这个项目的负责人罗万 · 泽尔斯(Rowan Zellers)告诉我：也许在几年之后他们会很危险，但现在还不会。 "我不认为发布它很危险ーー实际上，我们需要发布它，特别是对研究这个问题的研究人员，这样我们才能建立更好的防御系统。我们需要所有这些社区——安全方面的、机器学习的、自然语言处理的社区——互相交流，我们不能只是隐藏模型，或者删除这些模型，然后假装它从未发生过。"

一个贪婪的读者

人工智能是通过让它摄取大量真实新闻文章的语料库创建的，这个数据库名叫RealNews，与格罗弗一起被引入。这个120G的图书馆收藏了从2016年底到今年3月的文章，这些文章来自谷歌新闻追踪的排名前5000的出版物。

通过研究数百万篇真实新闻的风格和内容，格罗弗建立了一个复杂的模型，模型包括某些短语或风格是如何使用的，文章中哪些主题和特征是相互关联的，它们又如何与不同的媒体、观点联系在一起，等等。

这是通过一个"对抗性"系统完成的，在这个系统中，模型一方面产生内容，另一方面评价它的可信度ーー如果它没有达到阈值，生成器会再次尝试，最终它会知道什么是可信的，什么不是。目前，对抗性设置在人工智能研究中是一股强大的力量，经常被用于从头开始创建逼真的图像。

格罗弗并不是随意生成文章的，它是高度参数化的，这意味着它的输出高度依赖于输入。因此，如果你让它编造一篇关于疫苗和自闭症谱系障碍相关研究的假文章，你可以自由地指定这篇文章应该看起来像是出现在 CNN，福克斯新闻(Fox News)，甚至是 TechCrunch 上。

我生成了一些文章，这里放一个例子，它是文章的第一部分：

连续创业家丹尼斯 · 曼格勒(Dennis Mangler)筹集了600万美元，用于创建基于区块链的无人机送货服务

by Devin Coldewarg 2019年5月29日

无人机送货并不是什么新鲜事，这就引出了一些问题: 这项技术有多可靠？是否会出现服务问题和打扰用户的问题？

无人机技术正在发生巨大变化，但其最明显的用途---- 包裹递送---- 从未大规模地得到完善，更不用说第三方服务了。但这种情况或许即将得到改变。

连续创业者丹尼斯•曼格勒(Dennis Mangler)有着丰富的从业经历——以这个短命而疯狂的行业的控制性标准来衡量——从一家顶级的韩国风投，到亚马逊(Amazon)的全资子公司，从功能齐全的无人机修理店，到商用无人机机队开发商。

但在他的最后一家公司(亚马逊的 Prime Air)倒闭后，他决定再次尝试与 Tripperell 合作，尝试无人机送货。 Tripperell 是一家总部位于旧金山的公司，致力于打造加密货币令牌空间，在区块链和送货之间架起一座桥梁。

他们正在建立的系统非常完善ーー正如 Medium 上的一篇文章所说，它将首先使用 Yaman Yasmine目前还比较简单的众包无人机维修平台 SAA，来创建一个无人机组织，目的是促进海外网络和国内产业的融合。

从那时起，两位创始人开始组建Tripperell公司，让商业化的无人机根据自己的智能合同进行配送。

考虑到它在我给出日期、范围、我的名字和标题后，只花了大约十秒钟就完成了，它的表现已经很不错了。 (我可能会调整下标题，但是如果你仔细想想，它的也还是有点道理的。)

注意，它实际上并不知道我是谁，也不知道 TechCrunch 是什么。但它将某些数据与其他数据做了关联。例如输入以下3个毫无关联的内容，1.保罗•克鲁格曼(Paul Krugman)在《纽约时报》(New York Times)上发表社论称，2.该团队提供的一个例子是一篇"以某种风格"为主题的社论，3.翻唱乐队的行话。

“它的编码并不复杂，我们没有告诉这个模型谁是保罗 · 克鲁格曼。但它可以从大量的阅读中学习，"泽尔斯告诉我。系统只是试图确保生成的文章，使该部分和作者关联的其他数据足够相似。 "它还会学到一些东西，比如,'保罗•克鲁格曼(Paul Krugman)'倾向于谈论'经济学'，而我们没有告诉它，克鲁格曼是一名经济学家。"

很难说它会在多大程度上影响到一个特定作者的风格ーー它可能注意到了某些东西，也可能没有。而众所周知，人工智能模型对于分析来说是不透明的。它模仿的风格超越了作者，甚至在我生成的一篇"福克斯新闻"的段落间创建了"阅读更多"的超链。

但是，创建文章的这种功能依赖于判断文章是否能令人信服，而这也是评估文章“生成器”的质量是否良好的“鉴别器”。如果你给鉴别器输入其他东西会发生什么呢？事实证明，它比现在任何其他人工智能系统都要好，至少在测试文章的领域内，在确定哪些是假新闻，哪些是真新闻上面，比其他人工智能系统都要好。

自然语言的局限性

很显然，格罗弗最擅长检测自己生成的假文章，因为在某种程度上，它知道自己的工作过程。当然，它也可以高精度地检测其他模型，如 OpenAI 的 GPT2。这是因为当前的文本生成系统有些共同的弱点，了解了一些例子以后，这些弱点对于“鉴别器”来说就更加明显了。

"这些模式不得不在两个糟糕的选项做抉择。第一个糟糕的选择是你只相信模型，"泽尔斯表示。在这种情况下，你会遇到一种复合错误问题，即一个错误的选择(考虑到它必须做出的选择数量，这是不可避免的)会导致另一个错误的选择，以及再下一个错误的选择，等等;"如果没有监督，他们往往会偏离轨道。"

泽尔斯解释说:"另一个糟糕的选项是更安全地使用它。"他引用 OpenAI 的决定，让生成器创建几十个选项，然后选择最有可能的一个。这种保守的方法避免了不太可能的词汇组合或短语，“但是正如泽尔斯指出的，“人类的语言是高概率和低概率词汇的混合体。如果我知道你要告诉我什么，你就不会说话了。所以肯定有些事情是很难预料的。"

上文说的以及文本生成算法中的其他习惯使格罗弗能够以92% 的准确率识别生成的文章。

尽管你非常聪明，但是你不能只是把那些它没有检测到的内容挑出来，然后把它们放在一起培育，以图做出更有说服力的结果。事实证明，这种策略实际上帮助不大ーー由此产生的"超级算法"仍然会以类似的方式出错。

自熄的危险

表面上看，格罗弗好像是一个相当危险的工具。稍微调整一下它为我创建的文章，就可以轻松地通过不熟悉该主题读者的鉴别测试。那么为什么该团队要公布它，还要公布它的工作原理呢?

首先，把它做成简单易用的app形式，"是希望研究人员能够轻松地使用这个模型，但是我们也做了限制，不会让它完全公开，"泽尔斯澄清道，“即便使用起来如此简便，用它来作恶的可能性也很低。”

他指出："如果你只是想写10篇采访新闻，你完全可以自己写。"事实上，很难想象哪个幕后策划者会为了写几篇假新闻而费尽心机。 "但如果你想写10万篇文章，你可以使用我们的工具ーー但是当我们从假新闻源头那里得到的文章越多，就越容易发现对手。" 因此，也可以把它看成是某种“钓鱼”的阴谋，这种“已知假新闻”很容易识破。

然而，无需担心假新闻有个前提假设，就是假定有一种方法可以将格罗弗的算法应用于一般新闻，或者用户有动机首先质疑或验证他们阅读的文章是否真实。很可惜，这个前提暂时还不成立。

“这完全是一个与机器学习无关的问题，”泽尔斯承认。“我们如何让它对人们有用呢?”我们如何让人们在网上阅读新闻时，能够检查它是否是假的，并想要这样做呢?”

没有人工智能能对此给出一个好的答案。希望我们人类能够胜任这项任务。

《TechCrunch》网站6月10日刊登了Devin Coldewey的文章《为了发现假新闻，这个人工智能首先学会了写假新闻》

译：安东

分享到:

閱讀更多 安東的日常 的文章

關鍵字: 人工智能保罗·克鲁格曼无人机

人工智能准备利用假新闻的“海啸”摧毁互联网

谷歌试图教孩子们如何辨别假新闻

1分36秒成交额突破百亿元海外网友误以为是“假新闻”

1分36秒成交额突破百亿元老外以为是“假新闻”

1 分 36 秒成交额突破百亿元老外以为是“假新闻”

视界｜1分36秒成交额突破百亿元海外网友误以为是“假新闻”

京东方面回应“刘强东退出管理层”：假新闻

ofo否认“卖身”，回应“假新闻”；碧桂园总裁莫斌鞠躬致歉；44家P2P平台爆雷案件已立案

再传被滴滴蚂蚁金服联合收购 ofo：假新闻

有赞获腾讯$1.5亿投资？白鸦回应：假新闻

Google AI首席科学家李飞飞或因五角大楼AI项目事件离职李飞飞回应：“假新闻”

假新闻+人工智能=世界大战？兰德公司称AI或使人类更接近核战争

小米太无耻了。

小米高管不只口嗨了，在国内拳打友商，在国外却开始下跪了。下一步，我猜小米会喊，高通爸爸，人家爱死你了，人家已经五体投地了哟。

蹭热点！说说我理解的手机包装盒事件。

今早醒来刷头条，发现大批米系自媒体铺天盖地发文嘲讽华为系自媒体，忍不住好奇了解了一下情况，原来是刚发布的一加8 海外版手机的手机包装盒上面印了一句话:with easy access to the Google apps you use most.而这句话也印在前段时间发布的小

苹果公司正式发布iPhone SE二代手机

新品名为“iPhoneSE”，拥有跟iPhone 8相似的外观，搭载了苹果当前最新的A13仿生芯片，具备IP67级别防水防尘能力，配备4.7英寸LCD材质屏幕，支持原彩显示，配备了Touch ID指纹识别。

华为河图、麒麟芯片和鸿蒙OS三驾马车并行？华为生态建设布局深远

至于受很多人关注的华为河图全面落地问题，官方有消息称，2020年第二季度会提供100个华为河图测试点，测试点到第四季度会增加至1000个，测试覆盖空间包括智慧园区、旅游景点、高铁站和机场等。

小米高管表示，四千毫安时 5G 手机，和三千多毫安时 4G 手机一样

小米科技高管卢伟冰在近日表示，5G旗舰手机如果5G网络全开，功耗会比4G手机高20%，4000mAh的5G手机大约等于4G手机的3200mAH；今年Redmi坚持把5G手机的容量控制在4500mAh以上，也是考虑到5G网络耗电大的原因，今年很多5G智能手机均采用大电池的设计。

5G画风变了：麒麟985落地首跑，荣耀坐上开往高端的「地铁」

荣耀30Pro/30 Pro+同时搭载麒麟990 5G SoC，相应的其它配置更高：Wi-Fi6+，支持红外遥控，USB 3.0 Type-C接口。

旗舰手机标配Wifi 6 换Wifi 6路由器的时机到了吗？

现在，家庭宽带都在500M左右，大部分手机也不支持Wifi6标准，换Wifi 6无线路由器有点早，因为换了Wifi 6无线路由器网速也不会变快。

2020年5G手机卖不动？继苹果砍单25%之后，华为小米纷纷跟砍？

都说苹果手机卖不动了，可我看想买iPhone手机的人还是那么多，不然之前苹果公司怎么会限购？数据显示，3月份在国内的 iPhone 销量比 2 月份激增 416%，达到约 250 万部。

干翻华为P40系列荣耀30也玩中

而今天的华为发布会上，荣耀30、30 Pro、30 Pro +3个版本中、大、特大杯齐亮相，又一片全新5G SOC，麒麟985也要登场。

程序员辞互联网工作，跨行传统上市公司，上班第1天就蒙了

原来男子是从事互联网工作，后面觉得是互联网寒冬来了，就坚决辞去互联网工作，跨行选择了一个教育传统上市公司，可是第1天上班就蒙了，公司让做的活儿太死板了，没有发挥空间，同事一点都不友善，领导不放权，而且管理线超级单一，氛围一点都不一样，所以想离职。

苹果发布新款iPhoneSE，3299元起售

北京时间4月15日晚，苹果正式发布了新款iPhone SE，搭载了A13仿生芯片，支持最新的iOS 13系统，支持 18W快充，也支持Qi无线充电。SE机型苹果到目前为止只发布了两款，这是iPhone产品体系里小屏和低价的典型机器。

我很纠结：我究竟适不适合做亚马逊电商？看了这三条你就知道了

请仔细阅读，关于跨境电商你想知道的都在这儿

政府对于跨境电商行业的大力支持给咱们广大跨境电商卖家吃了一颗“定心丸”。我们所做的跨境电商事业在一定程度上不再是为个人谋利益，而是成为了中国产品走向世界，为国家赚取外汇的主力军。

骗子手段太“精明”：商家赔了货物又赔款，亚马逊平台骗术大揭秘

在开始文章的干货分享之前，先给大家讲一个商家被用户勒索的案例。有一位朋友刚刚加入亚马逊跨境电商平台两个多月，在这期间有位美国用户在他店铺里面购买了一个毛巾架。

做跨境电商这么多年，今天才知道给国外客户发文件原来这么简单

做过跨境电商朋友肯定知道，很多国外客户对于有些商品看不懂说明书，想索要商品使用视频教程，毕竟视频信息量大，容易理解和快速上手。

值得收藏！三类卖家三种选品方案，总有适合你的一个……

网上很多所谓的“大佬”喜欢吹嘘用某某工具就可以迅速选品效率，迅速取得很高效率等等，其实这类人就是在卖软件，收培训费用…

万万没想到！亚马逊平台上面卖床单竟营收一个亿！你还在等什么？

做店铺这么多年，今天才知道我的listing突然被封，竟是因为……

亚马逊小白看过来！请采纳这些：亚马逊选品和运营的小建议

亚马逊卖家如何爆单？跨境精细化运营攻略必看

不收保证金、入住费、年费，还免三个月佣金，我也想入驻这个平台

咱们今天不说主打欧美市场的亚马逊，只谈一下以东南亚市场为主的Shopee。好多人都听说过，但是没有真正了解过，好多人想加入Shopee但是顾虑重重，今天我来给大家普及一下关于Shopee小秘密。

马云终于要辞职了，留下的话句句触动人心

去年，在教师节这天，阿里巴巴集团创始人马云今天公开信宣布：一年后的阿里巴巴20周年之际，即2019年9月10日，也就是今天，他将不再担任集团董事局主席，却留下句句触动心灵的话！！

等等，明年5G手机将迎来大降价

11月26日下午，联发科技（MediaTek）在深圳举办“联发科技 5G方案发布暨全球合作伙伴大会”，正式发布了全新的5G新芯片品牌——“天玑”，同时带来了首款集成式旗舰级5G移动平台——天玑1000。

微信公开课PRO版2019正在进行时，往届各自都有什么黑科技

微信公开课pro版2019，为期两天微信大会正在广州火热进行中，本次会议主题为：同行WITHUS。微信这一款超级应用，已经深入到我们生活的方方面面，所以这48小时的未来盛宴必将吸引无数眼球。

推出「信任分」升级「闪购」，美团本地生活这盘棋有多大？

小海按：美团的超级App梦想更近了？Tech星球文 | 马微冰陈桥辉头图 | IC Photo王兴曾说，“太多人关注边界，而不关注核心。”

5G我们超越了6G我们也将领先! 美国为什么会害怕失去5G领导地位呢

而且在我们国内和美企中，有相当一部分觉得我们研发不了5G，更特说超越他们了。由于，我们在科技领域一直是，装备一代，研发一代，探索一代。

界读｜华为：帮助英国共渡疫情难关，无端批评令英国蒙受损失

前段时间，英国首相呼吁员工在家办公的第二天，英国网络就出现大面积崩溃现象，不仅无法正常上网，而且电话也不能打、短信也不能发，给用户造成了很大的困扰。

为什么华为今天可以傲视群雄，在世界上立于不败之地？

为什么华为今天可以傲视群雄，在世界上立于不败之地？因为五年内没有人能超过整个5G领域，所以美国人无法超越，为什么？

血战「在线办公」，阿里、腾讯、字节、华为的底牌与大杀器

小海按：前端杀手级应用，后端云服务，在线办公「四小龙」之战开启。本来，在线办公更多的是阿里巴巴的主场。

2020年最强拍照旗舰来了华为P40系列多项业界首创香！

原来华为P40Pro+在上一代P30 Pro潜望式镜头横置长焦镜头模组和感光器件基础之上，进一步采用全新的多反射潜望式光路折叠技术，实现5次反射光路，光程比上一代潜望式长焦提升178%。

今天聊一聊直播

今天聊一聊直播突然谈到这个话题，是因为后知后觉的我，突然发现几乎所有大互联网公司都进军了网络直播行业，或者正在准备进军直播领域。

通过直播赚钱不容易，既要豁得出去，又要端得起来

今天咱们继续聊一聊直播吧当下，像头条、网易、百度等公司，看上去和直播八竿子打不着的公司，也开始涉足直播了。

AI和自动化技术联手，最终会让60%的工人失去现有的饭碗。

并非危言耸听，AI和自动化结合，势必会把数十亿人类踢出劳动力市场，数量巨大的失业工人，将会构成一个规模庞大的新阶级。AI最终会让60%的工人失去现有的饭碗。

这个网还能不能好好上了？今日全球IPv4地址正式耗尽

长期以来，一直令人担心的IPv4地址耗尽的问题，今天这一刻终于发生——所有43亿个IPv4地址已分配完毕，这意味着没有更多的IPv4地址可以分配给ISP和其他大型网络基础设施提供商。

12306系统不行？内行人告诉你它有多牛，阿里腾讯高手去了也膜拜

很多人认为12306系统很不好，之前我也是这么认为的，因为我觉得像双十一这么大流量，阿里都能承受住，为什么12306不行，这其实是误解，12306拥有着神一般的架构设计，平时的压力比淘宝大的多。

有内幕？美国防部授与微软百亿云合同，亚马逊不满发起诉讼

据路透社消息，10月25日，美国防部将高达100亿美元的十年期战略合同授予微软公司，这一举动引起亚马逊的不满。

未来之芯--RISC-V总部从美国迁往瑞士，华为、阿里是其成员

北京时间26日消息，国际开源芯片技术组织RISC-V基金会周一宣布，由于担心美国的贸易限制，计划将总部从美国特拉华州迁往瑞士。该基金会首席执行官卡利丝塔-雷蒙德（Calista Redmond）表示，希望确保美国以外的大学、政府和企业能够帮助开发其开源技术。

神话还能继续吗？几度过山车，比特币半年来首次跌破7000美元

比特币价格今年如同坐上过山车，年初的3000美元到最高13861.9美元，今天跌破7000美元，算是这半年来的最低点了。说起比特币，给人印象最深刻的，莫过于2017年末到2018年初的暴涨了吧。

刘强东卸任后，突然宣布一个“好消息”，让马云措手不及！

苹果的疯狂其实从未停止，AirPower或将重新启航

可是，苹果事实上一直都在推动终端产品进入全面无线时代，所以他们是不太可能在真正意义上放弃这款产品。有外媒称，苹果目前正准备重新启动AirPower项目。

曾保护近4亿中国人的电脑，却因得罪阿里、腾讯，惨遭市场淘汰

曾保护近4亿中国人的电脑，却因得罪阿里、腾讯，惨遭市场淘汰随着网络的不断发展，如何确保网络信息安全成为人们十分重视的问题。

互联网流量需求增大希腊民众“宅生活”考验网速

英国咨询公司Tech4i2报告指出，在疫情期间，希腊的互联网流量需求至少增长50%，但网速仅下降1.2%，而在大多数欧洲国家，网速平均下降了5%-7%。

互联网科技企业，传统办公模式该走向何处?

　　纽约，处于美国疫情震中的城市，工作模式大多是使用公司发放的电脑进行远程办公，而在这之前，部分互联网企业本来默认每周三为在家办公日，所以大家对在线办公可以说驾轻就熟。

微信又悄悄上线一新功能～网友却开始担心

备注后的群聊名称仅自己可见往后再也不用为分清乱糟糟的微信群聊而困扰不过从目前来看只有iOS端上线了这一新功能安卓用户还需要再等等并且此次更新为后台更新无需到AppStore更新即可看到这个新功能该功能上线后网友们纷纷站队但也有网友视野开阔担心起另一件事对于微信新功能群备注你觉得实

正式确认！孙正义退出市值5959亿阿里，20年与马云成就彼此

文：小娜说到孙正义这个名字，我们很多人都知道他是日本软银集团的创始人兼总裁，但他除此之外也有另外的身份，那就是阿里巴巴最大的董事之一。阿里之所以成为今天的阿里，与孙正义的投资是分不开的。当时，马云和孙正义仅仅交谈了五分钟，孙正义当即就决定投资阿里，而且一下就投资2000万美元。

科技添柴“非接触经济”升温

新华社记者王全超摄中国同拉美和加勒比国家举行视频工作会议，就新冠肺炎疫情防控开展交流。亚历山大·培尼亚摄在中国科学技术大学附属第一医院，乘客用“无接触电梯按钮”操作电梯。

好像在哪见过？华为nova7官宣余承东:何必只有一点点

全新iPhoneSE根据此前爆料，此次华为nova7系列将有nova7 SE、nova7和nova7 Pro三个版本，可能会采用“麒麟985+麒麟990”或“麒麟820+麒麟985+麒麟990”两种芯片组合。

行业红利、资本涌入，疫情后的在线教育聚师网如何“涅槃”

2018年，线下培训机构受到了相关部门政策的影响，整体发展势头趋降，然而市场上对于教育的需求却在不断增加，于是，大量学员开始把需求放到了线上，其中，职业教育在这方面的变化尤其明显。

数字货币真的来了？首吃螃蟹者传出，碰一碰功能露脸

苏州相城区政府相关人士对此未予置评，区金融局人士表示“不便答复”，其他多个当地机关单位称尚不知情，央行苏州市中心支行表示“以总行口径为准”，央行总行方面未予确认。新京报记者程维妙陈鹏编辑岳彩周校对薛京宁

实例 | 200 SMART运动控制基本指令详解

C_Dir:表示电机的当前方向信号状态，0 = 正向 1 = 反向。 START:触发开始发脉冲信号，必须要在运动轴空闲时发送一次信号，必须用边沿触发。