人工标注帮助AI快速落地

2022-11-03 16:58:03   来源:商业新知网

随着人工智能的发展,数据的训练量非常大,数据标注公司应运而生,这些公司以网络方式运作,一个平台有产品经理和项目经理,接到一个任务就找人来做,大家通过网络群组报名后,由产品经理来培训,之后各自领取自己的任务,登录账号进行标注,检验经理校验合格后就付钱,不合格则需要重新修正。

“目前已经形成庞大的数据加工队伍,仅北京就有一百多家专门从事数据标注的公司,全国从事这项工作的人大概超过千万,很多头部的互联网技术企业都有自己的数据标注公司。” “这个阶段数据对性能的贡献是最大的,数据越多越丰富、代表性越强、模型效果越好,算法的健壮性和鲁棒性就越强。目前情况是大部分AI公司都还没有实现盈利,但标注公司除外。

国外也是一样,无人零售、无人驾驶等都需要大量的人力,基于用工成本的问题,除了隐私数据之外,他们会把标注工作放在第三世界国家完成,马来西亚、泰国、印度等国家都有数据标注分公司。


(相关资料图)

常见的报道中,数据标注总被描述为“血汗工厂”,这项工作和从业者被描述得廉价低质,人被重复性机械式的劳动异化。

目前这种大量的人工标注是有价值的,因为理论上解决问题很难,但有了大量数据,设计深度学习网络,可以在特定场景特定应用中用数据训练神经网络,从而在很多场景中可以让AI快速落地占领市场、驱动行业应用、促进行业升级和迭代。

“比如在手机玻璃缺陷、高铁轨道的缺陷、电网高压线绝缘子损坏等检测工作中,无人机拍摄画面后,由人来检测,随着数据量增加,机器得到的训练越来越充分,机器慢慢可以自动检测,类似工作可以很大程度上由机器代劳。”目前人工智能的智能性虽然比较弱,但在各行各业都会带来改变,这是AI推动产业革命的机会。

数据标注需求持续增加

“现在科研界研究的都是无监督、小样本的深度学习,通过三维合成数据,用虚实结合的数据生成方式来训练机器,尽量减少数据的采集和标注,让机器自主学习、自主进化。”但由于缺乏理论上的突破性技术,所以虽然技术增长速度很快,但整体水平还比较低,目前的深度学习还是依赖基于统计意义的大数据模型,这要求数据足够多、足够均衡、基本满足真实世界的分布。

因此,标注这项工作会一直存在。

随着无监督、小样本深度学习的进步,重复性标注的工作量会越来越少。“机器的识别和人一样,人经过几千年的进化,用语言用文字记录和存储几千年的文明,所以看到桌子就知道是桌子,看到灵芝知道是灵芝。机器也需要不断理解更多的内容,有数据标签,它才能学习,才会有智能。数据的加工是一个长期存在的过程,由画框到基础词汇,慢慢形成自己的知识图谱,才能自我推理和思考。”

目前的数据标注公司基本采取“计件付费”的模式,标注员的待遇与任务量和难度直接相关,熟练工一天能标几千张图片,月收入最高过万。这项工作也有一定专业性,受过培训才知道怎么标、标得清楚,人也要认真细心。“每天产生的数据量太大了,数据量持续增加,对标注的需求也持续增加。”

关键词: 持续增加 人工智能

上一篇:
下一篇:
精彩阅读

人工标注帮助AI快速落地

热点

随着人工智能的发展,数据的训练量非常大,数据标注公司应运而生。

即时看!机器学习:73%的企业迷途求生?

热点

大家都知道,机器学习(ML)是人工智能的关键技术之一,也是一项逐渐走向成熟的应用技术。

首个中文Stable Diffusion模型开源,IDEA研究院封神榜团队开启中文AI艺术时代

热点

生成内容一直被视为AI领域中最具有挑战性的能力。

环球最资讯丨世界首个!Meta AI开放6亿+宏基因组蛋白质结构图谱,150亿语言模型用两周完成

热点

如今,在蛋白质结构预测领域,各大厂也出现了「百家争鸣,百家齐放」。

《中国广电IP骨干网建设项目可行性研究报告》专家评审会在京召开

热点

10月30日下午,《中国广电IP骨干网(CBNET)建设项目可行性研究报告》专家评审会在北京召开。

从“围炉烤茶”到“热奶宝”,我发现了一些潮流的秘密(第591回)

热点

抓住时令,降低用户的获得成本,满足用户的社交欲,这几乎就是近几年爆火的小物件的原因。

世界观点:赛博周刊|纸皮狗成时尚,甄嬛传出盲盒,鹤岗是不是好选择?

热点

双11大词典是双11到来之际诞生的有梗新词,带有本年度消费特色。

今日讯!政企合作!重庆移动、广电、中广电移动携手创新广电5G垂直应用

热点

根据协议,三方将重点围绕5G政企信息化业务、联合组网试点项目、生态资源及能力、产品体系构建四个方面开展政企领域合作。

全球时讯:腾讯、联通设立合营企业获批,二者今日股价上涨

热点

联通创新创业投资有限公司与深圳市腾讯产业创投有限公司新设合营企业案获批,审结时间为10月18日。

浙江各地广电全力推进5G业务 固移融合成主流

热点

日前,浙江华数组织召开“5G业务市县联动发展专题会议”,就5G业务发展工作的省市县支撑联动进行解读和部署。

财富

观速讯丨融资丨「金晟新能源」完成数亿元B+轮融资,达晨资本、基石资本联合领投

资讯

融资丨「金晟新能源」完成数亿元B+轮融资,达晨资本、基石资本联合领投,博世、陕汽、国调战新、广东省产业发展基金、中小企业国中基金、博时基

每日热闻!融资丨「来好宿」完成数千万A轮融资,易宝支付旗下基金领投

资讯

融资丨「来好宿」完成数千万A轮融资,易宝支付旗下基金领投,本次融资资金将主要用于乡村民宿覆盖、整合及运营团队升级。

融资丨「同诺康」获得天使轮融资,动平衡资本领投

资讯

融资丨「同诺康」获得天使轮融资,动平衡资本领投,本轮融资资金将用于研发管线推进、AI平台的升级以及团队建设。

以色列安全公司Ox Security完成3400万美元种子轮融资丨海外邦

资讯

以色列安全公司OxSecurity完成3400万美元种子轮融资丨海外邦,OxSecurity主要利用PipelineBillofMaterials(PBOM)技术标准,帮助客户检测企业与

浏览器兴亡,公司耍流氓

资讯

浏览器兴亡,公司耍流氓,你会难受,然后对着手机笑起来

被首富开除,是一种怎样的体验?

资讯

被首富开除,是一种怎样的体验?,时间会告诉我们答案。

对中国人来说,保时捷还是太便宜了

资讯

对中国人来说,保时捷还是太便宜了,背靠中国的欧洲新王

当前速看:双11再掀「扫金热」:理财失败攒金豆,直播专坑年轻人

资讯

双11再掀「扫金热」:理财失败攒金豆,直播专坑年轻人,“年少不知黄金香,现在越买越上瘾”

环球最新:陆正耀「走不出」瑞幸?

资讯

陆正耀「走不出」瑞幸?,9块9一杯,陆正耀重操旧业

火锅进入“小鲜肉”时代

资讯

火锅进入“小鲜肉”时代,“吃火锅,好吃健康全都要。”

即时看!机器学习:73%的企业迷途求生?

大家都知道,机器学习(ML)是人工智能的关键技术之一,也是一项逐渐走向成熟的应用技术。

首个中文Stable Diffusion模型开源,IDEA研究院封神榜团队开启中文AI艺术时代

生成内容一直被视为AI领域中最具有挑战性的能力。

环球最资讯丨世界首个!Meta AI开放6亿+宏基因组蛋白质结构图谱,150亿语言模型用两周完成

如今,在蛋白质结构预测领域,各大厂也出现了「百家争鸣,百家齐放」。

《中国广电IP骨干网建设项目可行性研究报告》专家评审会在京召开

10月30日下午,《中国广电IP骨干网(CBNET)建设项目可行性研究报告》专家评审会在北京召开。

从“围炉烤茶”到“热奶宝”,我发现了一些潮流的秘密(第591回)

抓住时令,降低用户的获得成本,满足用户的社交欲,这几乎就是近几年爆火的小物件的原因。

苹果举行主题为超前瞻秋季新品发布会 AirPodsPro2正式登场

北京时间9月8日凌晨,苹果举行主题为超前瞻的秋季新品发布会,在此次发布会上,备受关注的iPhone 14系列新机、新款Apple Watch Ultra以

微软正为Windows12开发新驱动框架 提升新老显卡性能

Windows 12系统可能会在2024年到来,按照正常的节奏,其开发工作应该早已秘密进行。日前,有开发者从Windows 11最新预览版Build 25188中

华盛顿地铁站首次亮相为视障人士扩展旅行路线

5月25日消息,一款旨在帮助视障人士或盲人行人使用公共交通工具的应用程序在华盛顿地铁站首次亮相。该应用程序名为Waymap,旨在为盲人和视

2022年情况又要变了!华硕高管:今年PC恐怕要供过于求

这两年来,由于疫情导致的居家办公及远程教育需求爆发,一直在下跌的PC市场枯木逢春,2021年更是创下了2012年以来的最快增长,然而2022年情

垃圾佬的心头好!西数新款固态盘SN740曝光

对于DIY垃圾佬来说,散片、拆机件、工包……这些名词怕是并不陌生。本周,西数推出了主要供应OEM厂商的新款固态盘SN740。SN740升级到了第五

虚假宣传、误导消费者 倍至冲牙器关联公司被处罚

后来者要想在激烈的市场竞争中立足,如果可以背靠巨头享受大树底下好乘凉的红利,那自然是皆大欢喜,没有这个福气,也大可凭借自己一步一个