2006年,当时在伊利诺伊大学(University of Illinois)、现就职于斯坦福大学(Stanford University)的李飞飞(fei-fei li)发现,挖掘互联网可能有助于改变人工智能研究。语言学研究已经确定了8万个“名词同义词集”,或称同义词集:描述同一类事物的同义词组。李博士估计,互联网上的数十亿张图片,每种同义词集都有数百个例子。收集足够多的人工智能培训资源,你将拥有一个远远超过该领域所见过的人工智能培训资源。“很多人都在关注模特,”她说。“让我们关注数据。”结果就是ImageNet。
互联网不仅提供了图片,还提供了标记图片的资源。一旦搜索引擎提供了他们认为是狗、猫、椅子或其他东西的图片,这些图片就会由亚马逊提供的众包服务“土耳其机械”(Mechanical Turk)招募的人员进行检查和注释。结果是一个由数百万张经过整理和验证的图片组成的数据库。2012年,通过使用ImageNet的部分内容进行训练,一个名为AlexNet的程序展示了“深度学习”的巨大潜力——也就是说,比以前使用的神经网络拥有更多的层。这是人工智能繁荣的开端,也是一个旨在为其提供训续数据的标签行业的开端。
本文来自作者[沐言mio]投稿,不代表大向号立场,如若转载,请注明出处:https://dx-led.cn/keji/202412-10066.html
评论列表(4条)
我是大向号的签约作者“沐言mio”!
希望本篇文章《人工智能公司将很快耗尽大部分互联网数据》能对你有所帮助!
本站[大向号]内容主要涵盖:国足,欧洲杯,世界杯,篮球,欧冠,亚冠,英超,足球,综合体育
本文概览: 2006年,当时在伊利诺伊大学(UniversityofIllinois)、现就职于斯坦福大学(StanfordUniversity)的李飞飞(fei-feili)发现,挖...