企业数据治理的成功要素之一:数据战略管理

0817102358.png

前言:作为一名数据服务工作者---资深“乙方”,见过、听过或亲身经历过很多的数据治理相关的项目,如:数据交换共享项目、数据治理项目、主数据项目、元数据项目……,这些项目中,有非常成功的——用的很好,也有差强人意的——勉强在用,还有没上线就下线的——基本没有使用。如果我们Review下这些项目,也许我们不难发现影响数据治理项目成功或失败的因素有很多,这些因素有管理方面的、业务方面的、技术方面的、企业文化方面的等等

在笔者看来,数据治理项目的成功要素可以总结为以下几点,接下来的一段时间我会跟大家一起分享数据治理项目的各个成功要素,欢迎关注!

  • 企业数据战略管理

  • 数据治理架构设计

  • 数据治理的时机与切入点

  • 组织与保障体系建设

  • 技术和工具——工欲善其事必先利其器

  • 建立长效运营机制


本期分享主题【数据治理的成功要素1:企业数据战略管理】,本文大纲:

一、数据战略是什么?

二、数据战略不是什么?

三、数据战略的四个要素

四、数据战略的三个层次

五、数据战略制定的方法和工具

六、总结


一、数据战略是什么
战略原本是军事领域的专用名词,是指指导全局战争的规划和方略。战略决定了组织的活动方向和内容,解决“干什么”的问题,是根本性的决策。在DAMA-DMBOK中对数据战略是这样定义的:
1.png
战略是选择和决策的集合,共同绘制出一个高层次的行动方案,以实现高层次目标。通常,数据战略是一个数据管理计划的战略,是保存和提高数据质量、完整性、安全性和存取的计划。然而,数据战略计划可能还包括利用信息达到竞争优势和支持企业目标的业务计划。数据战略必须来自与对业务战略中的所固有的数据需求的理解,这些数据需求驱动了组织的数据战略。数据战略的组成部分包括:

  • 为数据管理制定激动人心的愿景

  • 数据管理商业案例摘要,附带精选的例子

  • 指导原则、价值观和管理远景。

  • 数据管理的使用和长远目标

  • 数据管理成功的管理措施

  • 短期的(1~2年,具体、可度量、可操作、可实现、有时限的)数据管理方案目标。

  • 说明数据管理的角色和组织级其职责和决策权概述。

  • 数据管理方案的组成部分

  • 数据管理实施路线图

  • 数据管理的项目章程

  • 数据管理的范围说明

简单来说,企业数据战略包括:数据管理的愿景(长期目标)、中期目标、短期目标、实施策略、实施方案、实施路线图等。
二、数据战略不是什么
2.png
数据战略是企业愿景吗?
可能是也可能不是,或者说不完全是。我们看下各大公司的企业愿景是什么。
IBM:无论是一小步,还是一大步,都要带动人类进步。
苹果公司:让每人都拥有一台计算机。
阿里巴巴:分享数据的第一平台,幸福指数最高的企业,活“102”年。
腾讯:科技向善。
百度:成为最懂用户,并能帮助人们成长的全球顶级高科技公司。
用友:用技术和创想推动社会和商业进步。
企业愿景是企业利益相关者的本质诉求的整合,是企业战略的最高指引,可以理解为企业的长期战略。在当今席卷全球的颠覆性技术浪潮中,市场变化莫测,相对遥远的长期数据战略,笔者更倾向于哪些有着明确目标、明确范围、明确实施路径,具备可执行、可实现性的短期数据战略。世界变化太快,谁都无法预测10年后的世界是什么样子的,企业数据战略的指定一定要具备应对市场和技术变化的能力。这里申明,笔者并不是反对企业制定长期的数据战略规划,而是要在长期的数据战略之上细化出短期的可执行、可实现、能见效的战略目标,“小步快跑、快速迭代”。数据战略是企业战略的一部分,而企业战略是实现企业愿景的规划和部署。
数据战略是数据架构吗?
显然也不是,至少说不完全是。数据架构是用于定义数据需求,指导对数据资产的整合和控制,是数据投资和业务战略相匹配的一套整体的构件规范。数据架构包括正确的数据定义、有效的数据结构、完整的数据规则、健全的数据文档。数据架构整合了数据、流程、应用、组织、规范和技术,其典型输入包括:企业数据模型、企业价值链分析、数据库架构、商务智能或数据仓库架构、数据集成和整合架构、数据质量管理架构、以及文档和内容管理架构。
数据战略和数据架构不是一回事。定义数据架构的决定,是数据战略的一部分,实施数据架构的决策是战略决策。数据战略会影响到数据架构的设计,反过来,数据架构支持数据战略的实现,并指导其决策。笔者认为:数据架构侧重于技术,是企业数据管理的战术范畴,数据架构对上承接数据战略目标,对下联通数据战略实施计划。数据战略的落地除了需要数据架构的技术支撑,也需要企业数据文化的建设。
既然数据战略既不是看似缥缈的愿景,也是技术相关的架构,结合DAMA-DMBOK给出的数据战略定义,我们尝试总结下企业的数据战略究竟是什么。笔者看来:数据战略就是企业为实现某些业务目标而做出的数据规划和部署,主要包括:数据战略目标、数据战略范围和内容、数据战略实施策略、以及数据战略的实施路径和计划,这也就是我们所说的“战略四要素”。
三、数据战略的四个要素
3.png
1、数据战略目标——愿景和目标
愿景是制定企业战略的起点,是企业的长期战略,而目标是企业短期内要达成的明确目标,是企业的短期战略。企业数据战略目标的规划设计不仅要有“诗和远方”的田野,也要考虑生活“眼前的苟且”。正如我们前边提到的阿里巴巴公司,大多数人都知道阿里巴巴是一个电子商务公司,可马云说阿里巴巴是一家大数据公司,其远期的数据战略目标是“分享数据的第一平台、幸福指数最高的企业”。阿里系的产品,如:天猫、淘宝、支付宝……,每时每刻都在生产、汇集、加工着大量的数据,这些数据是具备变现能力的。通过数据的变现和分享,希望阿里成为幸福指数最高的企业指日可待。如果我们把“分享数据的第一平台、幸福指数最高的企业”理解为阿里的远期数据战略的话, 当年阿里如火如荼的研发AliSQL替换Oracle的战略就是那个时期阿里的中期数据战略,这个战略从部署到实施花了10年之久;而当前被炒上天的“数据中台”就是目前阿里的短期数据战略,并且这个战略目前已经实现了。这里只是举例便于理解,也许阿里的数据战略并非如此关于数据中台的话题,网上有太多的概念了,后边有机会的话可以分享下我对数据中台的理解,这里就略过了。
2、数据战略范围和内容——战略定位
战略定位是回答了“做什么”、“不做什么”的根本问题,企业数据战略定位,就是定义企业的数据管理/数据治理的范围和内容。按照DAMA的给出的数据战略范围主要包括:数据架构、元数据管理、数据标准管理、数据质量管理、主数据和参照数据、数据安全管理等。以上每个部分内容都可各成体系,那对企业来说,数据治理范围和内容该如何选择,却是摆在企业面前不得不回答的问题。这里,笔者建议企业的数据治理定位应充分考虑以下几点因素:企业的痛点需求是什么,希望实现的目标是什么,实施数据治理就能解这些问题吗,数据治理的投资计划(人力和资金),期望的投资回报率。把以上问题问题都想清楚了,你的数据战略定位也就清晰了——或选择全域治理、或选择个别亟待治理的主题。

 

3、数据战略实施策略——致胜逻辑

致胜逻辑是解决了“怎么做”,“由谁做”,“做的条件”、“成功原因”等问题,是战略的精髓。我们都知道数据治理项目涉及的业务范围广、系统范围大、参与人员多,并且数据治理是一个需要不断迭代、持续优化的过程,不能一蹴而就。那么数据治理项目该从何处入手,谁来主导、谁来配合、怎样才能保证项目的成功实施并能够取得效果?这个问题不好回答。根据笔者这些年见到、听到或亲身经历的数据项目,成功或失败,很大一部分因素是由这个“致胜逻辑”决定的。成功的项目不表,我们看大多数失败的项目都可能会有以下几个特点:目标不明确、范围不清晰、主导人员分量不足、参与人员不够积极、过分迷信技术和工具、过渡依赖外部资源……。做正确的事远比正确的做事更加重要,事前想清楚数据战略的致胜逻辑,要比事后总结教训的成本低很多。数据治理项目的成功一定是将以上因素有机整合,忽视某一因素都可能会影响的数据治理的成效。
4、数据战略的实施路径——行动计划
行动计划是落实战略目标或指导方针而采取的具有“协调性”的计划安排。行动计划解决了“谁”、“在什么时间”、“做什么事”、“达成什么目标”的具体活动计划。行动计划要具备可执行性、能够量化、能够度量,遵循PDCA的闭环管理,定期进行复盘和检讨。前文我们提到:数据治理是一个需要不断迭代、持续优化的过程,不可一蹴而就经验告诉我们:数据治理绝对不是引入先进的技术、牛X的软件就能够解决的。项目建设过程需要企业高层的高度重视并给予足够的资源支持,需要有经验丰富的顾问团队,需要技术部门和业务部门的通力协作,这样提高项目建设的成功率。然而,项目建设阶段的成功并不代表数据治理的成功,建设阶段的成功企业数据治理项目的终点,却是企业数据治理的起点。路漫漫兮其修远,企业数据治理需要的是持续运营,将数据治理形成规则融入企业文化,是企业数据治理的根本之“道”。
四、数据战略目标的三个层次
数据战略的三个境界——此节内容并没有官方定义,单凭个人理解,如有偏颇但求指正。笔者认为企业数据战略大致可以分为:满足基本的管理目标和业务目标、创新与创业、定义在数字化竞争生态中的角色和地位,三个层次。这三个层次并不是不同企业不同的数据管理目标,而是企业数据战略的在不同阶段、不同成熟度条件下的三个具体形态。
4.png

1、第一个层次——短期目标
满足基本的管理决策和业务协同。通过解决企业的数据管理中的各类问题,以满足决策分析和业务协同的需要,对于该层次的战略目标,笔者认为是企业最基础的、最迫切需要的、最能击中企业痛点的。随着多年的信息化建设,企业上了多套业务系统,而这些业务系统是由业务部门驱动建设的,缺乏信息化的顶层规划,各系统各自为政、各成体系、信息孤岛……,系统之间的数据不标准、不一致,导致的应用集成困难、数据分析不准确。可以说目前国内绝大部分企业都是处于这个状态,而信息技术的发展速度又太快,已逐步形成了技术倒逼企业数字化的转型的趋势,而高质量的数据资产,无疑是企业数字化转型的基石。
2、第二个层次——中期目标
创新与创业。基于数据实现企业管理的升级和业务的创新,通过数据的利用拓展新业务、构建新业态、探索新模式是笔者认为的企业数据战略的第二个层次,也是企业数据战略的中期目标。数据战略不再是企业战略的支撑,而是引导,或者说是相互作用,这个阶段“IT即业务”!对于传统制造企业利用数据的治理和融合,可以加速管理的创新、产品的创新、销售模式的创新,例如:利用数据治理加强集团管控、基于客户偏好的个性化定制、利用数据的供应链协同和优化、基于市场预测的创新产品设计与快速上市等等。对于服务行业利用大数据的探索服务的新模式,数据可以拓宽服务的视野,实现模式领域的横向拓展、服务精度的纵向延伸,例如:根据消费者需求推出定制化的主题房,酒店新零售的服务模式,都是酒店服务业在业务创新方面上的尝试,大大提升了客户的粘性,提高了酒店的盈利点。这样的案例,在金融服务、餐饮服务、医疗服务、教育服务等服务行业,每天都在上演……。未来的服务业的竞争将更加白热化,而数据资产的利用价值将愈发明显。
3、第三个层次——远景目标
定义在数字化竞争生态中的角色和地位,企业数据战略的最高奥义。用友董事长王文京预言:“未来所有企业都将是数字化企业”,针对这个观点本人深以为然。科技的变革将改变企业的业务形态和竞争模式,未来的数字化竞争中,数字化将是不可忽视的核心因素,企业数据战略的部署和成功实施,将决定您的企业在未来的竞争和数字化生态中,是领导地位、挑战者、特定领域者或是淘汰出局。“什么样的愿景,决定了什么样的未来”,企业数据战略愿景的规划一定要有未来的“诗和远方”。将数据战略愿景融入企业行动方针和核心价值观中,勾勒出企业未来的“图景”。例如,马云描述阿里巴巴的愿景:分享数据的第一平台,幸福指数最高的企业,活“102”年。
五、数据战略制定方法与工具
数据战略的制定以企业战略为基础、以业务价值链为模型、以管理应用为目标,以可执行的活动为步骤,通过系统化的思维,挖掘信息以及信息间的规律,经过科学的规划和设计,形成企业数据化运营的一幅蓝图。对于数据战略规划的方法,目前业界还未形成一套成熟的方法论体系,但是,IT咨询和IT战略规划的方法论已经比较成熟,可用作企业数据战略规划的参考,我们先看下各大知名咨询公司的IT战略规划方法:
埃森哲 IT战略规划方法论
5.png
IBM IT战略规划方法论
6.png

德勤  IT战略规划方法论
7.png

无论哪家方法论,对于IT战略规划本质上都是一样的,基本都包含了三个步骤:

1、调研分析,关键活动有:战略理解、需求分析、现状评估、行业最佳实践对比……

2、远景规划,关键活动有:业务规划、组织架构、技术架构、数据架构、应用架构、IT支撑……

3、实施策略,关键活动有:项目实施、进度和质量管控、效益分析、基础支撑……

以上IT咨询规划方法,同样适用于企业数据战略的规划设计,但在数据战略规划设计时需要重要考虑以下几个核心问题:

推荐文章

   一片小小的人工智能视觉芯片能做什么?无人驾驶汽车主动识别并避让行人、摄像头实时甄别在逃犯……这些影视作品中的情节,或许不久将可通过基于嵌入式人工智能视觉芯片的“解决方案”成为现实。  人工智能芯片被视为未来人工智能时代的战略制高点。在视觉感知领域,人工智能视觉芯片正逐步应用于智能手机、安防监控、自动驾驶、医疗成像和智能制造等领域。  可根据AI需求成像  纵观信息产业发展历程,从个人电脑时代到移动互联网时代,承载高性能计算的芯片决定新型计算平台的基础架构和发展生态,并掌握着产业链最核心的话语权。  中国科学院院士张钹指出,传统硬件架构难以满足人工智能时代深度学习的要求,新的算法需要新的硬件来支撑。同时,芯片的结构将越来越像“大脑”,类脑芯片、智能芯片等将是人工智能的发展方向。  “所谓视觉芯片,实际上是一种具有高速图像采集和实时图像处理功能的片上集成系统芯片。”中国科学院半导体研究所半导体超晶格国家重点实验室研究员吴南健介绍说,在日前举办的国家自然科学基金优秀成果北京对接会上,吴南健带领研究团队展示的新型视觉芯片(VisionChip)科研成果很是引人注目。  据介绍,这种视觉芯片集成高速图像传感器和大规模并行图像处理电路,能够模仿人类视觉系统视觉信息并行处理机制,解决现有视觉图像系统中数据串行传输和串行处理的速度限制瓶颈问题。  吴南健解释说,人工视觉的架构分两部分,类似于人的眼睛和大脑。人的眼睛是一个典型的图像传感器,能够摄取图像并且进行一些噪音去除等初级图像处理;人的大脑神经元网络是一个视觉图像处理系统,具有非常强的对所摄取的视觉信息进行并行处理的能力。  AI视觉芯片与摄像头的关系是——芯片做的是大脑,摄像头做的是眼睛。这里就存在一个问题:大脑该如何控制眼睛?远望智库人工智能事业部部长、图灵机器人首席战略官谭茗洲解释道,传统的技术方法是定义一个通信控制接口,但在视觉应用中这种做法会非常复杂。人眼的成像是非常聚焦的,只看到关注的东西。当AI算法解决了“要看什么”的问题后,前端成像就有了目标,可以把所有的资源都调配到关注的对象上,做到“指哪打哪”,也就是取出噪音的处理过程,可以更高效智能地处理视觉信息。这种根据AI的需求来成像,能解决很多以前解决不了的问题。  “通常以前处理的方式,是通过摄像头把信息摄录,传到服务器或云端后,利用服务器上的显卡进行运算,现在是将视觉芯片嵌入摄像头,让其本身可以处理信息,做成专用芯片,如果芯片大批量生产,在价格上会便宜非常多,极大降低成本。这就是目前这项技术突破的核心价值。”谭茗洲在接受科技日报记者采访时指出。  比人类视觉更具优势  在我们通常的印象中,一个视力正常的人可以迅速且毫不费力地感知世界,甚至可以详细生动地感知整个视觉场景;但其实这只是一个错觉。  “人类生理视觉有着天然的局限,只有投射到眼球中心视觉场景的中间部分,我们才能看清楚。比起人眼来,嵌入视觉芯片的机器将具备相当多的优势,因为可以传感更宽的频谱范围、更高的清晰度、更宽的视角,其视力远不止5.0,在夜间也可以看得很清楚。如同AlphaGo战胜‘围棋天才’一样,在某些应用场景,其视觉在准确性、客观性、稳定性等方面都要比人类视觉更具优势。”谭茗洲指出。  吴南健介绍说,目前,国内外在人工视觉芯片领域的研究主要是CMOS图像传感器芯片技术、并行图像处理技术和CMOS集成技术。在CMOS图像传感器领域,国际技术水平朝着高分辨率、宽动态范围、高帧率、高智能化、宽波长范围和三维成像的方向发展。人工视觉系统芯片能够完成图像获取和初级(图像滤波)、中级(特征提取)、高级(特征识别和不规则处理)3个图像处理步骤。  “视觉芯片关键要解决运行效率和处理3D影像这两个问题。以往视觉芯片处理信号面临的最大问题是因运算量太大导致处理信息速度低,以及摄取的照片是把三维世界‘压缩’成二维影像,在一张平面上已分不清物体距离远近、立体空间形状、空间位置等,而人眼可把这个还原。”谭茗洲表示。  记者了解到,新型人工智能视觉系统芯片,是将高速CMOS图像传感器、并行信号处理单元和输出电路集成于单一芯片内,实现实时视觉芯片系统。将不同功能的技术集成在一个芯片上有很多优势,实现图像获取和图像信息处理每秒一千帧的系统速度,可广泛应用于高速图像处理、快速图像识别解释、高速运动目标的实时追踪等领域。  谭茗洲指出:“目前,中科院设计的新型视觉系统芯片理念非常先进,仿照人类视网膜神经元机制设计,感光对信号的处理方式,拣取有用的信号进行处理,极大地减少了运算的体量。”  未来市场空间巨大  “以我个人的观点,视觉系统芯片会成为必然的趋势,就像手机和相机结合成就智能手机一样,目前在技术上已突破填充率低、分辨率低和信号干扰严重的难题,将科研成果转化并投放市场只不过是时间问题。”吴南健表示。  记者了解到,目前基于该技术的产成品已经试用于一些创新企业,比如在工业产品的自动化检测领域完全可以使用视觉系统芯片代替人工检测;在智能监控领域,过去需要将视觉处理芯片装在具有传感器技术的摄像头上,通过把数据结构化、再压缩送到数据中心的复杂方式完成数据传输和计算。  那么,视觉系统芯片如果在未来实现产业化,其市场空间有多大?据推算,2018年,图像传感器的市场规模在150亿美元左右,虽然其中120亿美元发生在智能手机领域,但未来发展比较快的4个领域是安防、国防、汽车、医疗,到2021年将会迎来40亿美元的市场空间,年增长率约10%—20%。  “视觉处理器的需求增长会更快,目前该市场的整体规模(包括硬件、软件、服务)在170亿美元至180亿美元,单从硬件来看也占到约30亿美元。如果视觉系统芯片可以覆盖70亿美元的市场规模,企业在这中间拿到1%的话,其盈利空间就已经很大了。”吴南健指出。  近年来,国内外一批新型人工智能企业,依托人工智能领域技术和算法优势向芯片行业渗透,加强人工智能芯片基础层研发。从市场格局来看,已经发展成为一个相对独立又相互依存的产业生态。在前端,索尼是图像传感器市场、生产和技术的领导者,紧随其后的三星和豪威科技也保持着不错的竞争力;在后端,Mobileye和英伟达(NVIDIA)是提供视觉处理芯片的主要厂商,在国内该领域的公司有地平线等。  然而,截至目前,尚未有企业实现“图像传感器+视觉处理器”集成式芯片的大规模量产。不管是现在的创业企业,还是已经在市场上占有一定份额的大企业,不是做图像传感器,就是做后端的视觉处理器。正如吴南健所言,这将给初创企业带来机会。 

热门文章

简单讲:互联网数据标注员是借助电脑或者移动设备对一些原始的数据进行处理,生产出满足AI公司机器学习需要数据的一群人。按照数据处理对象的不同,工作内容也会有差别,标注员的工作内容可以分为:分类;框选;注释;标记。按照所处公司的不同,标注员的工作方式也会有差别:有的人工智能公司处于对数据安全性考虑会自建标注团队,在这些公司工作的标注员可以保证自己工作内容不会出现太大变动;但一些服务于人工智能公司非专业外包公司标注员的工作则是项目制的,一个项目忙完紧接着做另一个项目,这样工作内容连续性较差,对一种类型的项目经验也不会积累的太多。就目前来说,人工智能还处于人工增长阶段,机器依然需要大量的数据进行训练,测试。标注员在当下也会一直存在,而且从业群体会越来越多,所以暂时不用担心这份职业会不会短期消失。就标注员从业来说,建议选择人工智能公司和专业的数据公司,这样可以保证自己在一个方向上了解的足够深入。就职场晋升来说,以牛牛数据为例:标注员——项目经理——项目总监——数据运营总监。首先谈谈什么是数据标注。数据标注有许多类型,如分类、画框、注释、标记等等,我们会在下面详谈。要理解数据标注,得先理解AI其实是部分替代人的认知功能。回想一下我们是如何学习的,例如我们学习认识苹果,那么就需要有人拿着一个苹果到你面前告诉你,这是一个苹果。然后以后你遇到了苹果,你才知道这玩意儿叫做“苹果”。类比机器学习,我们要教他认识一个苹果,你直接给它一张苹果的图片,它是完全不知道这是个啥玩意的。我们得先有苹果的图片,上面标注着“苹果”两个字,然后机器通过学习了大量的图片中的特征,这时候再给机器任意一张苹果的图片,它就能认出来了。这边可以顺带提一下训练集和测试集的概念。训练集和测试集都是标注过的数据,还是以苹果为例子,假设我们有1000张标注着“苹果”的图片,那么我们可以拿900涨作为训练集,100张作为测试集。机器从900张苹果的图片中学习得到一个模型,然后我们将剩下的100张机器没有见过的图片去给它识别,然后我们就能够得到这个模型的准确率了。想想我们上学的时候,考试的内容总是不会和我们平时的作业一样,也只有这样才能测试出学习的真正效果,这样就不难理解为什么要划分一个测试集了。我们知道机器学习分为有监督学习和无监督学习。无监督学习的效果是不可控的,常常是被用来做探索性的实验。而在实际产品应用中,通常使用的是有监督学习。有监督的机器学习就需要有标注的数据来作为先验经验。在进行数据标注之前,我们首先要对数据进行清洗,得到符合我们要求的数据。数据的清洗包括去除无效的数据、整理成规整的格式等等。具体的数据要求可以和算法人员确认。二、常见的几种数据标注类型1.分类标注:分类标注,就是我们常见的打标签。一般是从既定的标签中选择数据对应的标签,是封闭集合。如下图,一张图就可以有很多分类/标签:成人、女、黄种人、长发等。对于文字,可以标注主语、谓语、宾语,名词动词等。<img src="https://pic2.zhimg.com/50/v2-df93dc0a7e8a5fe387dc3774748b5f05_hd.jpg" data-caption="" data-size="normal" data-rawwidth="700" data-rawheight="400" class="origin_image zh-lightbox-thumb" width="700" data-original="https://pic2.zhimg.com/v2-df93dc0a7e8a5fe387dc3774748b5f05_r.jpg">适用:文本、图像、语音、视频应用:脸龄识别,情绪识别,性别识别2.标框标注:机器视觉中的标框标注,很容易理解,就是框选要检测的对象。如人脸识别,首先要先把人脸的位置确定下来。行人识别,如下图。<img src="https://pic2.zhimg.com/50/v2-7824903d6d840e2bb08d96b5c2fa5874_hd.jpg" data-caption="" data-size="normal" data-rawwidth="591" data-rawheight="398" class="origin_image zh-lightbox-thumb" width="591" data-original="https://pic2.zhimg.com/v2-7824903d6d840e2bb08d96b5c2fa5874_r.jpg">适用:图像应用:人脸识别,物品识别3.区域标注:相比于标框标注,区域标注要求更加精确。边缘可以是柔性的。如自动驾驶中的道路识别。<img src="https://pic3.zhimg.com/50/v2-4bc1dd2278182acf94fc426d7e6f2dc1_hd.jpg" data-caption="" data-size="normal" data-rawwidth="601" data-rawheight="377" class="origin_image zh-lightbox-thumb" width="601" data-original="https://pic3.zhimg.com/v2-4bc1dd2278182acf94fc426d7e6f2dc1_r.jpg">适用:图像应用:自动驾驶4.描点标注:一些对于特征要求细致的应用中常常需要描点标注。人脸识别、骨骼识别等。<img src="https://pic4.zhimg.com/50/v2-5e24f394516c75e45942c37ba0da85c0_hd.jpg" data-caption="" data-size="normal" data-rawwidth="583" data-rawheight="387" class="origin_image zh-lightbox-thumb" width="583" data-original="https://pic4.zhimg.com/v2-5e24f394516c75e45942c37ba0da85c0_r.jpg">适用:图像应用:人脸识别、骨骼识别5.其他标注:标注的类型除了上面几种常见,还有很多个性化的。根据不同的需求则需要不同的标注。如自动摘要,就需要标注文章的主要观点,这时候的标注严格上就不属于上面的任何一种了。(或则你把它归为分类也是可以的,只是标注主要观点就没有这么客观的标准,如果是标注苹果估计大多数人标注的结果都差不多。)三、有什么发展前途?数据标注员可以说是AI消灭了一部分工作又创造出来的一种工作。在未来AI发展良好的前提下,数据的缺口一定是巨大的。可以预见3-5年内数据标注员的需求会一直存在。至于发展,其实所谓一些熟能生巧的工作,都是有被替代掉的风险的。深度学习解决的一件事情就是熟能生巧。在这个岗位上,其实你的一些想法就代表了AI的想法,AI会根据你标注的数据进行学习,想想还是有点成就感的。数据标注可以说是AI的入门级岗位,未来可转向其他AI岗位。如项目实施顾问等,这就要求更多的工作技能,需要再工作中积累。作者:跹尘链接:https://www.zhihu.com/question/30654399/answer/264828926来源:知乎著作权归作者所有。商业转载请联系作者获得授权,非商业转载请注明出处。