AI新规则(一):亚马逊的AI向不良UGC宣战

时间:2019-11-12 16:44:56

神一局是一个36氪以下的编辑团队。它专注于科学技术、商业、工作场所、生活等领域。重点介绍国外的新技术、新观点和新趋势。

编者按:人工智能诞生已经60多年了。美国一些最大的科技公司(亚马逊、微软、谷歌、脸书等)。)刚刚开始挖掘人工智能的潜力,试图弄清楚人工智能将如何改变我们的未来。本文是fast公司编写的一系列文章《人工智能新规则》的第一部分。它介绍了亚马逊的机器视觉服务rekognition。原作者是马克·沙利文,标题是:亚马逊的人工智能正在使nsfw用户生成内容的战争民主化。

人工智能新规则(二):在这个容易分心的时代,微软希望人工智能能成为你的同事

现在,亚马逊备受争议的重新认识计算机视觉技术有了新的用途:删除食品网站上的不雅照片。

至少有一个例子。总部位于伦敦的交付服务oo正面临着严峻的内容审查挑战。他们的订购功能似乎有问题。送货上门的顾客经常发送食物照片和投诉。他们经常用不雅的照片对他们吃的食物发动光爆攻击。或者,他们会把食物做成私人部分的形状。真的吗?

事实证明,deliveroo的员工可能不想看到类似的事情。因此,该公司使用重新识别来识别不雅照片,并在它们被看到之前将其模糊或删除。

交货问题显示了一个日益严重的问题的奇怪之处。许多互联网公司以这样或那样的方式关注用户生成内容。近年来,我们越来越多地看到人性的阴暗面。随着网站越来越成为虚假新闻、暴力内容、假冒伪劣产品、恃强凌弱、仇恨言论等有毒ugc的温床,内容审计已成为重中之重。如果你像facebook一样财大气粗,你可以开发自己的人工智能或者雇佣大量审计员(或者两者兼而有之)来处理这种混乱局面。然而,资源较少的中小企业没有这种选择。亚马逊的内容审计服务源于此。

该服务是亚马逊网络服务的识别计算机视觉服务的一部分,这本身就是许多坏消息的主题,因为亚马逊似乎愿意为美国移民和海关执法局提供人脸识别服务。你可以在rekognition的网站上找到其他面向监控的应用案例,例如,它可以从不同的拍摄角度读取车牌,或者跟踪摄像机捕捉到的人的行走路径。

亚马逊可能正在寻找一个更积极的曝光其计算机视觉服务,所以这是它第一次谈论使用更新知识来监控ugc中的色情或暴力图像。rekognition内容审计服务可以检测上传到公司网站的图像和视频中的不安全或攻击性内容。

这是一个成长的行业。亚马逊ai副总裁Swami sivasubramanian说:“ugc的作用逐年增加,因为我们现在每天都在社交媒体上与朋友和家人分享两到三张照片。”Sivasubramanian说,亚马逊在2017年应一些客户的要求开始提供内容审计服务。

该公司可以为重新注册服务付费,这样它就不必雇人来检查用户上传的图像。像其他aws服务一样,内容审计服务采用现收现付模式,并根据亚马逊rekognition神经网络处理的图像数量定价。

毫不奇怪,内容管理服务的第一批用户包括约会和相亲网站,它们面临着快速批准上传到用户个人数据的自拍照的挑战。亚马逊表示,咖啡遇到百吉饼,沙迪正是为此目的使用rekognition,葡萄牙帮助他人创建约会网站soul也是如此。

这个人工智能不仅仅是寻找裸体。Rekognition的神经网络已被训练来检测各种可疑内容,包括枪支或暴力图像或通常令人不安的内容。以下是rekognition网站的功能分类:

[图片:亚马逊]

像所有其他aws内容一样,rekognition的新内容审计功能在云中运行。使用的公司可以告诉服务它想要检测什么类型的问题图像。然后,它将用户生成的照片和视频(通常存储在aws中)发送到rekognition服务。

亚马逊的深度神经网络然后处理图像,找到内容并标记任何可能令人反感的图像类型。神经网络将输出关于图像内容和图像被标记的置信度的元数据。结果如下:

然后,该代码将被发送到客户端的软件,该软件将根据编程的业务规则确定如何处理标记的图像。软件可以自动删除给定的图像,传递它,或者部分或模糊地处理它,或者将它发送给人类进行审查,等等。

用于图像处理的深层神经网络有许多层。每一层评估代表图像不同方面的数据点,计算它们,并将结果发送到网络的另一层。网络将首先处理顶级信息,例如图像中的基本形状以及是否有人。

西瓦苏布拉曼解释道:“然后它将被缓慢而持续地提炼,在每一个下一层将获得越来越多的具体信息。”慢慢地,神经网络可以连续识别图像中的内容。

aws ai副总裁马特伍德说,他的团队使用数百万个专有的和公开的图像集来训练他们的计算机视觉模型。他说亚马逊在培训中没有使用任何客户图片。

一些最大的更新内容管理客户没有使用该服务来审核ugc。亚马逊表示,拥有大型数字视频库的媒体公司需要知道每一帧的视频内容。Rekognition的神经网络可以每秒处理视频内容,用元数据描述视频内容,并标记潜在的有害图像。

伍德说:“机器学习真正擅长的一件事是分析视频或图像,然后提供额外的上下文。它可能会说,‘这是一个女人带着狗在湖边散步的视频,或者‘在这个视频里有一个穿着衣服的男人。’他说,在这种用法下,神经网络可以以极高的准确度检测危险、有毒或淫秽的内容。

[图片:亚马逊]

然而,计算机视觉科学的这一分支尚未成熟。科学家们仍在寻找新的方法来优化神经网络算法,以便更准确、更详细地识别图像。伍德说:“我们还没有达到收益递减点。”

Sivasubramanian表示,就在上个月,计算机视觉团队已经将误报率(错误标记图像为潜在不安全或攻击性的错误率)降低了68%,误报率降低了36%。他说:「这些空气污染指数的准确性仍有改善的空间。」。

除了准确性之外,客户还要求获得更多关于图像分类的详细信息。根据aws网站的介绍,aws内容审计服务只返回不安全映像的主类和次类。因此,系统可以将图像分为主要类别、包括裸体的主要类别和包括性行为的次要类别。第三级分类可以包括对所显示的性行为类型的分类。

加州理工学院计算和神经系统教授兼aws顾问皮埃特罗·佩罗纳(Pietro perona)说:“现在,机器的风格非常逼真。它会告诉你“里面有这些东西。”然而,科学家希望他们能做得更多。他们也希望机器能告诉这些人在想什么和正在发生什么。这是这个领域的发展方向,不仅仅是像购物清单一样列出图片中的内容。"

这种微妙的差异对内容审计至关重要。图像是否包含潜在的不良内容可能取决于图像中的人的意图。

甚至“不安全”或“恶心”的定义也是一个不断变化的目标。它随着时间而变化,在不同的地方有不同的含义。佩罗娜解释说,背景就是一切。暴力图片就是一个很好的例子。

佩罗娜说:“在某些情况下,暴力是不可接受的,比如叙利亚现实生活中的暴力,但在其他情况下,比如昆汀·塔伦蒂诺的足球比赛或电影中,暴力是可以接受的。”

像许多aws服务一样,亚马逊不仅向他人出售rekognition的内容审计工具:它也是自己的客户。该公司表示,正在使用该服务监控用户生成的图像和视频,以及在自己的市场上提交的用户评论。

译者:博西。

上海快三开奖结果 云南十一选五投注 上海时时乐开奖结果 安徽快3 天津11选5


图片新闻

在公厕收获流量“云纸”获数千万元 A 轮融资
铅笔道9月16日讯,据36氪消息,近期,专注公厕场景流量变现的“云纸”获得了数千万元a轮融资,资方暂不做披露。云纸成立于2017年底,主打公厕场景的“自助式免费扫码取纸”。迄今为止投放自动纸巾机 3
美国减少购买后,加拿大盼望中企进口天然气!中国已有更多选择?
美国近期又呼吁制造业将生产线迁回美国,但是大部分企业仍无动于衷。为了阻止苹果这一行动,美国迅速给出回应,声称如果苹果将生产线从美国迁出,那么其生产的零件运到美国将被加收额外的费用。今年9月底,苹果宣布
字节跳动回应将营收目标调至1200亿元:不予置评
新京报讯 9月30日,针对字节跳动将今年的营收目标调至1200亿元的消息,其官方称不予置评。今天稍早,据彭博社消息,字节跳动上半年营收好于预期,在500亿元至600亿元之间,因此字节跳动计划将2019

热门新闻

穆雷“无痛”上赛场 感觉久违了
国庆节当天,穆雷身穿大红色球衣亮相中网,十分应景。接受了髋部关节置换手术后,穆雷笑称自己多了个“铁屁股”。尽管曾是2016中网公开赛男单冠军,穆雷对这次复出不敢有太大预期,“我不知道能持续多久,但能这
享乐奢靡、违规公款吃喝、侵吞征地补偿安置款…山东这些党员干部
利用职务上的便利,帮助许廷强侵吞征地补偿安置款、侵占集体资金,涉嫌贪污、职务侵占犯罪。另外,高立厂违规同意用单位加油卡为员工私家车加油共计540元。寿光市营里镇财政经管统计站违规公款吃喝等问题。201
这4种病快60岁还没得过,恭喜你活到90岁不是梦!听听医生怎
吸烟是引发慢性阻塞性肺疾病、高血压、冠心病等慢性疾病的重要危险因素。研究证实, 慢性病的发生和发展与不合理膳食、吸烟、有害饮酒及身体活动不足等行为危险因素有关, 其中吸烟和被动吸烟导致心血管疾病和慢性