人人有功劳!脸书宣布使用海量图片训练AI算法

2018年05月03日16:29  来源:环球网科技综合
 
原标题:人人有功劳!脸书宣布使用海量图片训练AI算法

据美国科技媒体The Verge 5月2日报道,脸书在F8开发者年度会议上宣布,用户分享的一张一盘完美组合的煎饼图片,或是一幅精美的夕阳图片,都有助于脸书训练其AI算法,以便更好地理解图像中的物体。

脸书表示,这种从公开的标签中筛选图像的方法,可以收集数十亿张图像,来训练其软件,而无需人工对数据进行费力的分析和注释。最终的结果是,脸书创建了一个训练系统,该系统的算法击败了业界顶尖的行业基准。

“我们几乎完全依赖手工策划、人工标注的数据集。”脸书首席技术官迈克 斯克罗普夫(Mike Schroepfer)在F8上说:“如果一个人没有花时间在图像中标记某个特定的东西,即使是最先进的计算机视觉系统也无法识别它。”但脸书可以自动用标签标注Ins海量图片,利用这些图片收集相关数据,并利用这些数据来训练其计算机视觉和物体识别模型。“在图片网基准测试中,我们获得的最新结果比其他任何系统都要好1 %到2 %。”

这是一种实用的方法,但也引发了一些关于隐私和脸书竞争优势的有趣问题。由于脸书拥有并运营着一个庞大的平台,涵盖了Instagram、WhatsApp和Messenger等应用程序中的数十亿用户,因此脸书可以访问极其宝贵的文本和图像数据,只要这些文本和图像公开发布,脸书就可以通知其AI模型。但是用户可能并不一定知道他们共享的数据是用来构建人工智能系统的,而不仅仅是为了投放广告。

当然,脸书目前只是提取基于对象的数据,并不一定试图从照片内容中推断用户行为。但正如我们所知,脸书的面部识别系统可以自动为照片添加标签,该公司的确认为能够了解用户的身份以及他们在世界上的位置是具有价值的。

脸书正在建立一个更大规模的AI系统,主要是为了帮助它扩展其调节能力。除了为其平台新增了2万名人工版主之外,脸书还越来越多地寻求自动化,因为它正在努力应对俄罗斯选举干扰、剑桥分析数据隐私丑闻以及其他一些棘手的问题,例如如何调整平台内容、防止不良行为者滥用其工具。

斯克罗普夫(Schroepfer)说:“直到最近,我们常常不得不依靠一些反应报告,等待一些不好的东西被别人发现后,才采取措施。”“而现在,”他补充道,“大部分的调整工作都由AI处理,AI正在帮助该公司筛选和并清除其平台上的恐怖主义宣传、裸体、暴力,以及仇恨言论。这就是我们如此专注于核心人工智能研究的原因。我们需要新的突破,我们需要新的技术来解决大家都想解决的问题。”(实习编译:邓倩 审稿:李宗泽)

(责编:左瑞、邓楠)