新兴的数据标注行业遍布全球，全世界人都在为人工智能打工！

AI的新员工：数据标注行业遍及全球在印度和菲律宾等低收入国家工作的数十万人数据注释公司iMerit在印度加尔各答的办公室员工。随着公司越来越接受人工智能，新兴行业正在兴起，在该行业中，员工被用来“训练”算法以识别各种类型的数据 ,马达胡米塔·穆尔吉亚（Madhumita Murgia） JULY 24 2019 打印此页 26 在印度城市加尔各答的边缘，在拥挤不堪的梅蒂亚布鲁兹（Metiabruz）居民区，有460名年轻妇女在人工智能的先锋队伍中工作。这些女性，主要来自当地的穆斯林社区，正在帮助培训诸如亚马逊，微软，eBay和TripAdvisor之类的自动驾驶汽车和增强现实系统中使用的计算机视觉算法。

全女性中心是由印度和美国的数据标注公司iMerit运营的八个印度办事处之一，其2200名本地员工为制造业，医学成像，自动驾驶，零售等行业产生的数据海洋贴上标签，保险和农业。该业务是不断发展的数据标签行业的一部分，该行业在肯尼亚，印度和菲律宾等低收入国家雇用数十万名工人。如图8和Mighty AI之类的公司，以及埃森哲和Wipro等更传统的IT公司，正在组成所谓的“ AI供应链”，该供应链创建的算法能够解释包括驾驶镜头，搜索结果和照片在内的资料。美国和欧洲最大的跨国公司，包括Facebook，大众汽车和Google。如今，公司正在拥抱人工智能，将其作为自动化决策和帮助创造新商机的一种方式。挑战在于，支撑该技术的算法像新生事物一样幼稚。他们需要喂给他们数百万个带有标签的示例，以教会他们“看”。

内罗毕的旧金山数据标签供应商Samasource的工人©Fredrik Lerneryd / FT 若要教授自动驾驶汽车算法的路标含义，或分辨孩子和狐狸之间的区别，则必须逐帧观看数小时的镜头并标记物体。一个小时的视频需要八个小时才能注释。事实上，麦肯锡（McKinsey）在2018年发布的一份报告中将数据标签列为工业界采用AI的最大障碍。根据分析公司Cognilytica于2019年1月发布的报告，第三方数据标签解决方案的市场在2018年为1.5亿美元，到2023年将增长到超过10亿美元。“最大的技术公司不愿与培训数据，他们希望拥有客户关系[并且]明智地使用合作伙伴和采购，”位于旧金山的数据标签供应商Samasource的创始人兼首席执行官Leila Janah说道，该公司在肯尼亚，乌干达和美国设有办事处。 “但这就是为什么围绕道德的AI供应链进行对话如此重要的原因。在它开始走出他们的四面墙之前，我们必须确保我们设定了标准，而且这个市场不会阻碍服装工厂的发展。有巨大的机会来确保这个（标签）行业是一个积极的力量。”

新员工当大型跨国公司开始为消费产品开发机器学习算法时，数据标签要么通过亚马逊的Mechanical Turk之类的众包平台提供给零工，要么由低薪经济体的工人团队内部进行。萨拉·罗伯茨（Sarah T Roberts）等研究人员对像美国这样的国家的数十名科技工作者进行了采访，他们认为，与同公司的其他员工相比，这些承包商的工资通常被严重低估，而他们的工作却被视为卑鄙的。菲律宾的“屏幕背后”一书。 Samasource的创始人兼首席执行官Leila Janah©Fredrik Lerneryd / FT 随着需要贴标签的数据量呈指数级增长，大公司越来越多地转向第三方，这些第三方能够为专门提供特定类型数据（例如驾驶或医疗信息）的工人提供服务，并且他们也以道德的方式得到报酬和待遇。 Samasource的员工为沃尔玛，谷歌，微软，Glassdoor，大陆和通用汽车等公司提供数据标签，其总部位于内罗毕，拥有2800多名员工。“我们有一种劳动模式，雇用人们作为全职工人，并以生活工资支付福利。

平均而言，（当我们雇用他们时）我们的工人收入几乎翻了两番。”贾纳女士说。“我们与通常来自非正式定居点，乡村的人口一起工作，因此有机会获得一份高薪的工作，并为您提供计算机技能并使您接触AI，这意味着人们对此非常重视。” iMerit在加尔各答附近的全女性培训机构已成为计算机视觉标签的专业中心，该公司总体上雇用了50％的女性劳动力，其中大部分来自印度的低收入家庭。“这是一个不允许妇女出差去其他地方工作的社区。因此，我们开始为他们带来项目。” iMerit首席执行官Radha Basu说。人为因素人工智能供应链公司坚持认为，他们的工作不再涉及对猫，狗和房屋等基本物体的盲目，死记硬背的标签，而是已经演变成更加专业化的任务集。例如，iMerit员工可能会分析驾驶员的车载录像，包括面部表情和眨眼，以确定驾驶员的疲劳程度；

巴苏女士说，他们已经为亚马逊的Echo扬声器培训了语音剪辑，以理解语言并分析了单个建筑物和建筑工地的卫星图像，从而为保险公司培训了风险评估算法。 iMerit在加尔各答的工人 Samasource在Bayer的一个项目上工作，该项目要求注释植物的血管横截面以检测病害细胞以保护作物，并训练空中图像算法。Janah女士解释说：“我们希望专注于机器无法轻易掌握的复杂边缘情况，在这些情况下您需要人工来提供细微差别和判断力。那就是我们增加价值的地方。” 随着AI培训市场开始爆炸式增长，使用AI的西方团体正在寻求与具有社会影响力模型的更多道德外包公司合作。“人们第一次质疑那些不为AI供应链中的工人提供生活工资的[标签]公司。作为一家公司，如果您要让这些劳动者对您的数据进行培训，则应归功于他们对这些劳动者的公平对待，”贾纳女士说。巴苏女士说：“从长远来看，这些年轻的农村部落工人将真正改变其社区的经济能力。

西方来自谷歌

上一篇:数据标注加盟项目是骗人的吗？数据标注项目加盟怎么样？

下一篇:2020年2月4日数据标注任务汇总

推荐文章

汇数智能将致力于规范AI数据标注人才市场

人工智能行业内有这样一句话“有多少智能，就有多少人工”。当然这里的人工不是指生产流水线上的工人。这里的“人工”是指工作在人工智能最基础岗位上的小伙伴们。这个岗位是----数据标注、数据采集。我们知道人工智能的发展，得益于海量的数据采集和标注。机器是没有认知和记忆的。而数据采集和标注就相当于告诉了一个机器，这是什么东西，给机器的认知输入了“条件”。简单的说，如果你标注出错，那么人工智能也会出错。简单的说可能把梨子认识成苹果。在人工智能发展起步阶段，技术发展不成熟，在很多方面的要求都不太严格。比如说，在数据标注这块领域，前几年可能只要你有电脑，会操作就可以做。而且很多数据标注公司为了降低成本会找很多不专业的兼职来完成数据标注的工作。所以整个数据标注行业从业人员的要求、门槛是比较低的。当然这也直接导致了数据标注的质量是不高的。自2019年开始，越来越多的人工智能公司或项目，更加关注数据质量对AI智能的重要性和紧迫性，优质的数据才能有优质的智能结果，但是市场确认统一的专业课程及相关认证培训，人才市场一度混乱。一方面是人工智能公司找不到合适的专业的标注团队，另一方大量闲置人员又缺乏相关从业经验，人才供需结构矛盾越来越明显，造成AI公司对外包公司，外包公司对个人等相互之间的互不信任。为了解决这个问题，汇数从2019年初开始已经开始联合国内知名的人工智能公司及大厂，开始打造一套标准的且可持续的数据训练人才认证方案和体系，以规范现有的人才市场，为人工智能行业提供最专业的基础性人才大军。随着人工智能技术的发展，人工智能广泛的应用在生活、生产各个领域。人工智能对数据采集、数据标注有了更高、更专业、更精细化的要求。现在如果你还是一个只会操作电脑的计算机小白，那么你可能不适合数据标注这个岗位了。随着人工智能的发展，未来对数据采集、数据标注的质量要求会更高。那种粗制滥造的数据标注和采集，根本达不到AI行业发展的要求。所以，未来将有一大批不合格的数据标注员、数据采集员被这个行业无情的淘汰掉。数据采集、数据标注是人工智能领域中最基础的岗位，虽然是初级岗位但它及其重要。数据标注的质量会直接关系到人工智能项目是否能成功落地。目前人工智能行业发展迅速，行业内的专业人才稀缺。而目前数据标注岗位的人才职业化、专业化程度都是较低的，为了满足AI行业的发展要求，在未来对数据标注员、数据采集员进行认证就是趋势，只有达到专业的认证，掌握专业的技能，才能更好的完成数据采集、数据标注的任务。而这种专业至上的生存法则，才更能满足人工智能行业的发展的要求。

热门文章

为什么有些人说数据标注就是个坑？

对数据标注行业稍微有些了解的人都知道数据标注进入门槛低，适合很多人兼职也适合创业。正是因为数据标注行业的门槛低这个特点最近两年从事数据标注的小公司小工作室如雨后春笋般的遍布全车大大小小的县城。但是目前有个有趣的现象，那就是有很多进入数据标注行业做了一段时间的人慢慢的感觉数据标注行业就是个坑？为什么有些人会说数据标注就是个坑呢？其实对与有上述问题认识的人我们认为，这些人多数都是有于对这个行业对自身条件的不了解，盲目的开始进入数据标注行业的。为什么我们会这样说呢？下面就给给大家来分析下到底有哪几方面的原因：一、有相当一部分人是听了朋友或者网上消息说这行很火爆，好做，门槛低，也有一部分人了因此租办公室买电脑招人，然后就去群里面找分发项目的人就开张干起来了。可实际上这些人他们大多数都没有充分了解数据标注行业，更没有认真仔细得去调查分析，到底自己能不能做好一个项目，到底自己能不能有质有量按时交付的完成一个项目，到底自己有没有这个能力来管理项目。更多的人也没有去用长远的眼光去考虑数据标注项目。二、数据标注项目虽然入门门槛低，但是相当一部分有于理解认知应变能力上都不能保证去做好数据标注项目，还有一部分人由于自己对标注项目重视程度不足接到项目之后呢？不仔细认真的去阅读理解项目规则，更没有很好的对规则质检标准去培训员工，而对员工的要求主要看重每天的产出效率，从而导致接到手的项目做的质量很差，频繁的返工，有提项目甚至因为质量太烂项目方不给结算或者是结算比例很少，最终的结果就是做好些个项目但基本都是赔钱。三、虽然业内人都说数据标注简单，但是标注项目他也是一个系统性的工程，一个项目能不能做好并不简单的看项目好做就能赔钱。实际上决定项目赚不赚钱考验的是一个团队的项目管理水平，质量管理能力，运营能力各方面因素的。一句话再好赚钱的项目也照样有人赚钱也有人赚钱，要赚钱不是那么简单的。四、还有些工作室、小公司因为对行业不够了解等他们做了一段时间后发现，自己团队经常会没有项目做，而自己团队接项目的业务能力又不具备，甚至有的时候为了员工有活干去接一些价格极低根本就不赚钱的标注项目，时间稍微一长这些工作室团队就会赔上很多钱最终关门倒闭。五、下来要说的就是一部分人人兼职人员由于认识不到位，对项目的规则质量要求文件不认真阅读消化理解导致做的项目质量差返工有的甚至最后不结算，最终退出这行。更有一些人由于经验不足被标注行业的项目骗子给忽悠到辛苦劳动到最后结算时找不到人。标注行业本身由于进入门槛低，做的人很行业内盲目打价格战，导致很多转手二手三手的项目在质量工期的要求下根本就不赚钱甚至赔钱，所以在这里也提醒大家做任何事都要谨慎而行。

友情链接: