天创培训:您身边的信息安全培训专家!
行业动态
深度学习正在让用户隐私成为社交巨头的摇钱树?

  深度学习正在让用户隐私成为社交巨头的摇钱树?

  福布斯杂志最近写的关于使用深度学习技术,充分了解用户的四个惊人的脸谱网,它们分别是文本分析、人脸识别、广告和设计有针对性的人工智能应用。

  近年来,媒体对机器学习的深度,学习了很多人工智能等技术的基本介绍。一个企业不在少数相关的研究中,企业又如何在实践中加以应用呢?

  脸谱网是通过了解其用户和广告商“包装”用户数据进行业务。而它从业务运营到赚钱将回归到为用户提供有用的新功能,目前主要是提供视频和购物功能。然后,它还将利用这些功能进一步了解用户服务。

  随着社会网络的出现,人们的交流和对话交流对我们来说是有价值的,它已经成为一个“磁铁”,以吸收大量的用户数据。谁是那些涉及用户的数据,如何花费他们的时间,信息,如他们喜欢什么。对于脸谱网数据科学家在数据挖掘领域的工作,面临的挑战是,大部分数据非常杂乱,属于非结构化数据。

  虽然脸谱网平台12亿用户上传的照片,每分钟136000张,更新293000号的地位,但直到最近,脸谱网只能希望少量的非结构化数据(难以量化和信息)投入开采价值的计算机分析图标。

  深度学习有助于解决这一问题。深度学习技术使机器能够对自己的数据进行分类。一个简单的例子是,深度的图像分析工具,了解学习识别包含猫的图像,不需要被告知,看起来像猫。通过对大量图像的分析,它能够从图像的背景中学习到信息,比如猫图中可能出现哪些东西?任何文本或元数据可能表明图像包含一只猫?

  通过定量和方便的分析工具,以数据的形式呈现的见解,它有助于结构化非结构化数据。脸谱网的研究人员试图回答这样一个问题:该公司的产品更经常出现在与猫的形象?我们应该把重点放在喜欢猫的人上我们的广告吗?

  基本原理,说明了为什么深学习对脸谱网有用,随着深度学习算法变得更高级,它们可以应用到数据中,我们已经从文本到图像共享更多的视频。

  下面具体讲解用例来深入学习如何被用来获取价值,帮助脸谱网做给用户带来更多的方便,并且他们能够更多的了解自己的目标。

  1。文本分析

  脸谱网的很大一部分,共享数据或文本。视频可能涉及到更多的数据层面,但在获取洞察力方面,文本仍然可以带来同等价值。一个图像可能包含1000个字,但如果你只想回答一个简单的问题,你通常不需要回答的1000个字。任何数据回答你的问题都是噪音,会浪费资源用于存储和分析。

  脸谱网使用它来开发一个程序称为deeptext工具分析后的语境研究,然后提取该词的含义。通过分析单词之间的关系,神经网络可以根据单词的词义来了解词义的变化。由于这是一种监督和监督学习,该算法并不一定要解释每个单词的平均参考数据,如字典。相反,deeptext是基于怎样的词语学习。

  这意味着deeptext不会拼写的变化,俚语或特殊的语言使用。事实上,脸谱网所说的技术“支持多种语言”,因为它把标签的单词形式,它可以很容易地切换不同种类的语言,可以从一种语言的应用中学习到另一种语言。

  目前,使用的工具,根据交谈的人指向他们,他们可能要购买的产品。脸谱网已经发布了视频,例如如何解释deeptext根据上下文来决定是否为用户提供购物链接。

  2。人脸识别

  脸谱网使用名为DeepFace深度学习应用,致力于教它识别照片中的人。,公司表示在图片中的两个不同的人的身份是同一个人,最先进的图像识别工具比人类更准确——DeepFace识别成功率达到97%,96%的人是。

  这项技术的使用显然是一个辩论的问题。会过分隐私倡导者指出,这种工具,它可以使脸谱网,根据大量对脸的名字玩高分辨率图片的人群,这将给我们的匿名威胁在公共场所自由行走。欧盟监管机构同意,在2013,它将说服脸谱网的职能,从欧洲公民帐户删除。当时,社交媒体巨头正在使用早期版本的人脸识别工具,不是深度学习技术。由于该技术首次引起广泛关注,脸谱网并未透露其进展。也许,它是在等待一些隐私案件裁定,希望公布后,该计划的推出。

  三。有针对性的广告

  脸谱网深度使用神经网络(深度学习的基础)来决定哪些广告要显示哪些用户。它一直是其业务的基础上,通过机器本身尽可能多地了解我们,当推广告将以最深刻的形式,我们聚集在一起,该公司希望保持对谷歌和其他高科技的竞争对手的广告市场上的竞争优势,其竞争。

  4。设计领域中的应用

  脸谱网甚至决定,通过学习可以决定操作,提高AI的任务和深度,可以由机器处理。它实现了一个叫流量的系统,该系统采用深度学习分析到每个月的300000,模拟了机器学习模型,供工程师验证自己的想法,准确地找到了提高工作效率的机会。

  开放源代码

  脸谱网非常支持开源,其名为“脸谱网人工智能研究(公平)”的AI实验室的大部分研究成果都是免费供任何人使用或修改的。脸谱网基于火炬平台的深度学习技术,专注于平台环境,深入研究科技和社交网络的发展。

  该公司甚至GPU硬件设计的开源驱动的AI。超高速计算机专门针对深学习任务的执行进行了优化,任务往往需要很强的处理能力,因为它们涉及到大量的计算,对输入数据的处理速度要求很高。

  展望未来

  深度学习很可能会继续在脸谱网未来的发展中发挥重要作用。尽管潜在的新的应用程序现在的妈妈,但它提出的理念包括:自动生成的图像声音描述协助视觉障碍,并预测哪些地方需要更大范围的网络覆盖,网络的连接性能的使命,世界。从长远来看,他们是强大的人工智能和深度学习实验室也可能带来好处,无数的组织,无论是通过直接使用他们的服务,或间接受益于他们的开源支持。