数据标注在语音交互领域中的具体应用

语音交互属于人机交互的范畴,是人机交互发展到目前的一种最前沿的交互方式,简单来说就是用人类的自然语言给机器下指令,达成自己目的的过程。

随着人工智能的发展,语音交互技术逐渐成熟,并在人工智能时代有了先发优势。

目前,语音交互已经加速在智能家居、手机、车载、智能穿戴、机器人等行业渗透和落地。

日常生活中,我们接触到最多的语音交互应用大概就是各种语音助手,比如siri,比如小爱助手。此类语音交互工具不仅可以“听懂”我们说的话,而且还可以按照我们的要求完成各种任务。

经常使用语音助手的用户可能会注意到,不同语音助手之间是有着很大差距的,一个明显的表现就是语音识别的准确率上。

一些语音助手只能够识别简单的普通话,对于复杂的带有口音的内容识别的准确率很低,然而某些语音助手在这方面要表现的很好。

这背后一个很重要的原因是机器学习的数据量不足。我们知道目前人工智能的实现主要依赖于机器学习,机器学习最终效果取决于投喂数据的质量与数量。

语音交互领域常用的几种数据标注类型主要有:

一.语音转录

对不同说话人的说话内容进行转写:

二.语音合成

对说话内容进行合成转写:

理论上而言,标注数据数量越多,质量越高,那么最终的模型效果就会越好,表现在语音助手上的效果就是识别率的提高。

当然,语音交互的应用场景远不至此。未来的语音交互形式将会高效率、更加自然、更加接近于人本能的方向。



推荐文章

互联网时代,碎片化的消费行为令传统的零售方式难以为继,新零售作为一种全新的零售解决方案得到越来越广泛的应用。借助图像识别等AI技术的快速发展,新零售企业普遍实现了降本增效。高盛预测,到2025年,人工智能的应用将为零售业每年节省540亿美元的成本开支,并带来410亿美元的新收入。目前新零售行业主要流行的一种解决方案是“视觉识别解决方案”,即以图像识别为技术核心,摄像头、主板为硬件核心,对目标产品进行目标检测和分类,实现自动识别与结算,提升购物体验与节省人力成本。此类解决方案的背后离不开数据标注技术的支持,本文为大家分享某新零售场景下商品陈列检测数据标注项目案例,直观展现数据标注在新零售领域中的具体应用。1.标注对象商品、价签、未前进体、空排面。2.标注类型图像2D框。3.类别属性A标签(商品):标注所有类别的出售商品;B标签(价签):除空白的价签外均需要进行标注;C标签(空排面):货架上的缺货处,需要框出缺货估计大小,售空部分需要根据价签位置脑补出商品大小;D标签(未前进体):前排商品已售,后面有待售商品时,标注最前面的待售商品空位即可。4.各类物体的标注规则及判断标准a.叠放商品,每个都需标注(如泡面);b.扁平商品,只需要标注最上方一个(如巧克力) ;c.判断依据:漏出部分是否能确定是何种商品;d.里外排放的商品,只标注最外面一个;E.被遮挡的物体需要脑补出完整大小;5.标注工具数据标注工具。6.实例展示 

热门文章

        AI人工智能的迅猛发展得以于计算机深度学习技术的快速发展,而说到深度学习技术它又必然离不开底层基础的数据标注。        而在今天对于这种深度学习技术的基础数据标注工作也有相当一大部分人群不知道它到底是怎么个回事?什么是数据标注?数据标注是做什么的?这种问题就连一些从事这方面工作的人也有说不明白的。        要说起数据标注那我们也就不得不说下从事数据标注工作的数据标注员这个群体。人工智能、深度学习”这种名词看似高深莫测非常高大上,但目前提供给机器深度学习的数据标注采集等工作,仍是基于密集劳动力的人工智能数据标注产业。数据标注员和工厂流水线上的操作员也是没有多大区别的,可能有很多人觉得不可思议,但是目前这种情况 确实是事实。        那到底什么是数据标注呢?        要理解数据标注我们先来举个简单的例子:小时候大人教我们认识花朵时会指着花草给我们说 花会好多颜色,具体什么花开什么颜色,那我们就会慢慢记住什么花开什颜色。而人工智能深度学习也是和我们人类认知事物是一个道理。        人工智能深度机器学习的前提也是数据标注员根据不同的图片、语音、文本等数据标识出各种功能标签然后机器学习根据不同标签来认识出不同的事物。        数据标注是通过数据标注人员借助计算机标注工具软件对人工智能学习数据进行加工的一种行为。通常数据标注的类型包括:图像标注、语音标注、文本标注、视频标注等种类。标记的基本形式有标注画框、3D画框、文本转录、图像打点、目标物体轮廓线等。        目前大多数的数据标注工具软件都是支持图像、文本、多边形、视频等多种类型的。        根据全国范围内的不完全统计,目前全国数据标注行业的从业人员已经达到 100万之多。在人工智火热与闪亮的背后,数据标注产业作为做基础的支撑确实处于行业的低端下游的。