通过联合机器学习保护隐私数据頭條網

2020-12-25 19:34:35 佚名

这些步骤可确保考虑每个数据源的偏差，并准确地说明问题所在。例如，对来自世界各地卫生机构的心脏病数据进行联合模型的训练可以消除在对一个国家的国内数据进行训练的模型中发现的种族和性别偏见。

保护隐私的需要

如今，对隐私的需求从未像现在这样迫切，数据的价值可比作石油，被认为是个人最重要的资产。个人生成的数据类型从看似无害的细节（如零售偏好）到高度敏感的信息（如病历），甚至是可能会影响的政治观点。

呼吁提高数据安全性的一种可能的答案（越来越受到关注）是隐私保护机器学习（也称为联合学习，或联盟学习）的发展。在较高的层次上，联合学习是一种机器学习方法，可以协同训练模型，并旨在通过使用差异隐私和分散数据来防止数据泄漏。因此，联合学习允许个人数据保持匿名，同时帮助建立强大的模型。

用最简单的术语来说，联合学习不会将您的数据发送给第三方，而是在加密每个步骤的同时将模型引入了数据中。

专栏

深度学习入门系列讲解

作者：AI火箭营

199币

309人已购

查看

机器学习的未来是协作

隐私并不是使用联合学习来解决的唯一问题。它也消除了目前阻碍我们构建更高精度模型的障碍。这样的问题之一是，没有中央资源可以提取训练这些模型所需的所有数据。训练覆盖整个情况的模型将需要一系列数据类型，通常分布在各个机构中。

例如，为了捕获个人的财务状况并提供洞察力，必须对在多个银行和信贷服务，在线零售行为和付款习惯中发现的数据进行训练。为了增加复杂性，同一公司各部门之间的数据传输可能会面临与管理或隐私相关的问题。

联合学习为各方面各不相同的各方提供了机会，以协作方式训练比在单一数据源上训练的模型更准确的模型。

联合学习

高层次的联合学习可以分为三个步骤：

1. 共享的全局机器学习模型在可用数据上进行训练，并部署在分散的平台上。

2. 将模型下载到边缘设备，可以是智能手机，笔记本电脑或其他智能设备，然后使用其包含的数据更新模型。

3. 更新（例如，计算出的梯度）将被加密并发送回服务器，在该服务器上，来自多个设备的更新将被平均并用于改善主要共享模型。

4. 然后，共享模型由边缘设备下载，从而使模型的数据贡献者和策展人受益。

专栏

机器学习From Zero to All

作者：AI火箭营

199币

164人已购

查看

联合学习的组成部分

创建一个图表，以非常高的层次说明组成联合学习的各种元素：

构成联合学习基础的三点是：

隐私，数据结构和模型类型。随着不断变化的景观，增加复杂性和增加深度的新研究进一步扩展了这些观点。

1. 隐私 -隐私是联合学习的最重要方面。无论数据的提供者是公司还是个人，隐私保护都可以增进协作的信任度，保护敏感数据，并确保个人的合法权利。

2. 数据结构 -联合学习根据模型在其上训练的数据结构进行分类。数据结构类别有以下三种类型：水平联合学习、垂直联合学习和迁移学习。这些结构描述了数据的组织方式，特别是数据集是否共享相同的特征空间，或者它们是否共享相同的样本。这两个描述分别涉及水平学习和垂直学习。

3. 模型类型 -简单来说，要训练的模型是神经网络还是统计学习模型。这将取决于数据类型，数据量和所需的预测结果。

联合学习数据结构图

未来发展方向

尽管联合学习可能成为解决跨多个设备的大量数据的问题的解决方案，但仍然存在一些障碍。

1. 资源瓶颈-这些问题包括在训练期间连接的IoT设备的电池寿命不同的情况，这可能导致某些设备掉线。设备无法连接wifi，3G或4G网络等通信差异将影响网络。最后，网络上的设备之间的硬件规格（例如内存和CPU）可能会有所不同。

2. 数据差异—每个设备上的数据在质量，数量和一致性上都会有所不同。例如，如果收集用于人脸识别的图像数据，则图片中的照明，面部的多样性以及所贡献的数据量将影响本地训练的模型。这些局部模型的质量差异很大，最终会影响全局模型的整体质量和准确性。

专栏

基于深度学习的目标检测

作者：AI火箭营

599币

21人已购

查看

分享到:

關鍵字: 数据结构联合隐私

通过联合机器学习保护隐私数据

保护隐私的需要

机器学习的未来是协作

联合学习

联合学习的组成部分

未来发展方向

相關文章:

刚刚工作的毕业生，一个月只有2000多，是不是太少了？

为什么只有edg赚钱？

网上罗马仕充电宝20000毫安的，参数怎么很多样？哪个是真的？

我们买的新商品房还没有拿到房产证，怎么转卖最好？

为什么突厥人可以成功复国？是大唐的刀不锋利了么？

小高层16层高楼间距60米哪一层比较好？

金银花盆栽好养吗？怎么养？

长城对于抵御古代匈奴和蒙古人起到了多大作用？

什么树可以嫁接腊梅？

行情堪忧，还有多少教育机构的老师们五一假期有课上的？课时量多不多？

在农村“立夏节”都有哪些民间习俗？

男朋友失望分手，但对我还有感觉，答应我两个月之后可以在一起，我应该怎么做，才能改变之前他对我的看法？

工程分包乙方人员伤残谁承担？

有哪些看起来毫不相关的两个历史人物实际上有过联系？

13年雪铁龙世嘉自动挡7万多公里，没有水泡事故，多少钱能买？

22+吃土少女17年就有驾驶证了，今年才开始开车，想买个二手昂克赛拉，或者有什么好建议吗？

如何骑车去台湾骑行？

本人预算5万左右，想买一辆二手法系车！求推荐？

14年进口马自达5PK进口10年道奇酷威买哪个划算？

2020年，河南教育行业国务院特殊津贴推荐，河南大学并列第三，大家怎么看？

本田CRV2019款1.5T舒适版油耗高吗？

国外疫情如果没有得到有效控制，世界会发生什么事情？头脑风暴？

本田XRV这款车的整体表现怎么样？我想买1.5T自动豪华版，全款多少钱？

现在存款有14万，借了5万还没收回来，该做什么好？

2070super和5700xt买哪个比较好？

生完二胎后，感觉自己有点抑郁，总是想发火，特别烦躁，怎么办？

人这一生遇到的人和事为什么感觉都像是必然的经历？

现在校内校外到底教的是美式英语还是英式英语还是混搭英语？

上有老下有小，我们真的跳不出这个人生循环了吗？

如果外面正在下小雨，你会突然想起了谁？

初中同学许久未见大学期间突然联系请吃饭，态度还良好，我给推了，会不会让人很烦？

现在我觉得认真对某个人说我喜欢你什么的这种话好恶心，我爱你更说不出口，好恶心，是什么心理？

剧版的《何以笙箫默》和《再见王沥川》哪一个更好看呢？

计算机专业本科能够进入字节跳动、华为这些公司做开发吗？是否还需要继续读研？

生完二胎的你们，现在有什么感想？

华北适合种植蚕豆吗？

华为手机更新EMUI10.1系统后效果咋样？

大热天蜜蜂老是爬到箱外结群正常吗？

辣椒正是生长最佳期，偏偏有的辣椒苗蔫，不是病虫害是咋回事？

手机相机发展的最终形态会是怎样的？

华为为什么不出一款5寸全面屏手机呢？我想应该会有很多人支持吧？

生吃山芋，生吃胡萝卜，还有哪些蔬菜可以生吃呢？

为什么马铃薯不宜过早过迟播种？

疫情愈发严重，原油为何反而大涨？

生菜球很好吃，怎么种植才能高产呢？

装修高手来帮忙看下144平，套内122平，怎么三房改四房？ ？

大家帮忙看看这个房子如果要砸墙的话，怎么改比较好？

意蜂夏季喝什么水降温？

黄瓜种子催芽后种植需要打底水吗？

书友们展示一下自我感觉发挥较好的作品，一起学习？

婚前男方拥有个人房产，婚后将这房产卖出用这房产的钱来买房，怎么算个人财产？

男方出首付，婚后一起还房贷，房产证名字怎么写？

女儿离婚，婆家有3套房产，但都是婚前财产，父母应该怎么样为女儿争取利益？

三星低端A40S以及中高端A80值得购买吗？

如何看待今年高考报考人数超过一千万人？

97分！利物浦成五大联赛最高分亚军，与卫冕冠军曼城只有“一分之差”，是不是太苦了？

荣耀20值得等待吗？还是入手荣耀v20？谢谢？

曼联0-2卡迪夫，博格巴谢场时遭球迷辱骂，其竖大拇指+双手合十回应，你怎么评价？

泰迪一定要吃狗粮吗？

银行职员将存款500元打成500万元，储户把钱用完了需要担法律责任吗？为什么？

拉布拉多和金毛犬养哪一个比较好？

贝尔本赛季表现并不差，为什么会遭齐祖彻底放弃？

在取款机里取到假币该怎么办？

如果有张（J036519610）纸币，能否认定年号钞吗？听听大家的看法？

2019版人民币将要发行，那么99版和05版现在值得去收藏吗？

不流通的旧人民币值多少钱，该如何处理？

第四套人民币豹子号值钱吗？

第四套人民币豹子号值钱吗？

怎么分辨902绿幽灵？

EXCEL如何把数值批量转换成文本？

阆中古城离广元市多远？

宜宾：情感纠纷女子背幼子欲跳桥，路过民警救下, 你怎么看？

Excel中，有哪些激动人心的功能？

装修高手来帮忙看下144平，套内122平，怎么三房改四房？？