海天瑞声shortA-语音转写规范及标准

shortA-转写规范及标准

一、介绍

1. 使用谷歌浏览器,判断有效无效、选择属性、转写文本,需要贴着截取不需要预留。

a) 地址:http://123.56.137.109:5600/  

b) 账号:LY-shortA

c) 任务:shortA-李静

2. 登录成功后,同意保密协议,就进入工作页面开始工作;

 

1) 判断声音是否有效

有效:普通话/不标准的普通话,语音是标注中需要处理的有效语音

无效:典型举例如下(视具体音频随时补充无效原因)人工合成的声音无效唱歌无效

无法听清音频中的内容,噪音过大分辨不了文本内容

方言,如:粤语、上海话、闽南语等,非汉语的发音如日语

两人说话,可以分清主要说话人,把另一人声音作为背景音,正常转写主要说话人,需要无效情况如下:

重叠了,分不清主次,无效

都听不清不确定说的是什么,无效

多人说话一前一后的对话,无效

无人说话;整条音频只有一个字的无效

音频中全部都是歌曲、电视声等人工合成的电子音

一半人工合成的电子音,一半人的发音。整条无效

一句话中有2个或者以上的字听不懂无效

2) 性别:男|女(如果出现无法辨别的中性声音,标注为女)

3) 口音:有|无(有每个字发音都不标准个别字不分平翘舌个别字音不准不算口音)

4) 儿童:是|否(明显儿童,奶声奶气幼儿和明显的10岁以下青少年的稚嫩的声音)

5) 文本:分包后是按照音频时长排句子号的,所以会有连续相同的句子发音文本一致的情况,直接从前一句复制到下一句即可(连续多句的文本相同不是问题的句子是正常的)

快捷键:

无效:Alt+1;男Alt+2;女Alt+3;有口音Alt+4;无口音Alt+5;是儿童Alt+6;否Alt+7

 

二、文本标注规范及标准

1. 转写内容与实际发音内容一致,对于因为口音或者个人习惯导致的音变,仍按照原内容转写。Liu2奶→写牛奶;转写内容的完整性要与实际发音一致。轻微口音不改字

2. 标点:不加标点,可以写im  dont     @转写为at

3. 数字写法:按照数字的汉字写法写成“一二三…”形式,而不是“123”更不能是“壹贰叁”;注意: 读yao1写幺,读lia3写俩,读liang3写两,读1.5*1.8写一点五乘以一点八

4. 英文:全部小写 

a) 字母拼读小写加空格:q  q;k  t  v;m  p三   切记:务必字母拼读加空格

b) 单词小写,单词单词间加空格。如:“播放rolling in the deep”

5. 专有名词,人名和地名可以搜索到的歌名要写对。

6. 儿化音:一律不写儿化音。爸爸去哪er→爸爸去哪

但是发音有“儿”的要写出,比如:幼儿园,那些花儿

7. 语气词: 音频中说话人清楚地讲出的语气词,如 “呃 啊 嗯 哦 唉 诶”等,要按照正确发音进行转写。

8. 切音情况:切音的字听的清可以准确判断出来,正常转写,并且截取进红线

                切音的字听不清,需要靠猜测,这样的不要转写,且这个切音的字不要截取进红线

9. 保存:保存继续下一句快捷键(alt + enter),最后一句保存后,右上角出现提交按钮,提交后质检才能查标注员的任务。

10. 出现能确定发音,无法确定字形的情况,如果是歌名、专有名词、地名等,需要百度搜索写准确; 如果搜索不到,用同音字代替(同音字发音和音调都要和音频完全相同)

11. 一句话中一个字听不懂可以使用标签~代替(≥2个字听不懂,直接无效)

三、截取规范

1. 截取的区间音频必须与文本一致。贴着音频截取,从开始发音的点截取到结束发音的时间点。

2. 不要切到发音的字,不要有预留。

3. /后切音的字可以确认就截取进来,且转写

4. /后切音的字需要猜测出来,就不要截取进红线中,也不转写

 

 

四、标签:

{~}:代替不确定的或者听不懂的1个字,一条音频≥2个字听不懂,直接无效

 

五、注意事项

a) 需要截取不用预留不要切到字。

b) 超时回收:正常任务24小时(返工待修改任务48小时)后的凌晨3:07回收;

返工超3次,第4次返工系统回收

c) 新人第一个包做完提交后必须申请质检,首包通过后才可以自己随便领任务了

d) 音频 中有多人的语音重叠则无效,如果他人说话作为背景噪音的正常有效转写。一前一后说话也无效

e) 文本必须准确不确定要百度,实在百度不到的才能写同音同调(同音同调的字少用)

f)  只有1个字没有意义的语音无效

g) 一段音频有≥2个字听不懂的,直接无效

 

五、返工任务查看方式

a) 看到自己有返工的人,先查看返工意见看质检检查到哪句了比如检查到30句;进入该任务界面,先点击右上角的“质检情况”看具体条目的质检的反馈结果

b) 改好全部有反馈结果的条目后刷新界面,这样就能看到150句全部的条目,然后跳转到第31句自检,改好质检反馈的条目和31-150后可以再次提交给质检

 

六、数据审核标准和工资结算

申请的数据尽量在24小时之内完成,超时系统会自动回收。

每个任务包在质检通过之后,都会显示出具体的有效时长

工资=有效毫秒/1000/3600*单价

 


推荐文章

爱数语音标注登陆网址babel.magicdatatech.com/processmore/index.php用谷歌浏览器,鼠标拖动截取分段,内容右键,选择符号爱数这个任务非常简单,很好做,需要的看下文档1、需要根据说话人变化切换说话人,角色根据出场前后顺序标注2、根据说话人内容进行转写,不得漏字、错字、多字3、严重方言允许舍弃,带口音的普通话请尽量转写。4、在说话人说话的过程中,如果背景中有噪音,则需标注噪音符号,音乐早已标注MUSIC、其他人声噪音标注NOISE。5、如果两个说话人同时说话的,允许丢弃两个人同时说话的部分,但一个人说话的地方请保留。 (不要断句太散,如果句子中有一个字听不懂的,请联系前后语境,推测出最可能的字,尽量整句标注)一、开始标注语音文件一 时间边界定位:• 用鼠标选中波形,即为要标注的一段时间边界,此时会自动跳出对应的编辑框 图中的红蓝方框即为选中一段需要标注的时间边界。• 听音,在整段电话语音的基础上,根据语义和停顿时间等因素,在音频信号中每一句话的句首和句尾分别添加时间边界。即,一段标注框内,即为一段标注的话。• 每段前后需预留0.3s的空白段,但在没有可预留空白的情况下,不做预留,同理,叠加也不做预留,仅是说话段、并且能有前后留白的地方预留0.3s。二 文件标注:• • 此处主要标注语音文件的一些全局信息,包括说话人性别信息和语种信息(方言区)。标注时请按照实际情况选择。• 关于说话人的选择,客服标注奇数,用户标注偶数;• 如果第三个人的情况:点击“+”号,即可添加。• 编辑框内需要标注的是该句对应的文字• 如果是汉语交谈,则只能用简体汉字。对于语音中的数字部分需根据发音情况转换为对应的汉字,例如“27”→“二十七”;“我的电话是2381832”→“我的电话是二三八幺八三二(与发音相同)”。• 编辑框内正常语音的标注• 如果此语段为某一个人的汉语对话语音,请在标注时间边界后,选择对应的1或者2,编辑框内输入相应的文本。• 如果此语段为两个人交叉语音,关于重叠(交叉)的语音,即对于某个人的一句话未完,另一个人的一句话已经开始的情况:请不要标注该语段,空置就行。• 在整个语音中,需根据说话人的变换来增加时间边界(不同说话人分段标注)。• 如果同一说话人说话时间较长,则应根据其语义来增加时间边界,每个时间段的长度最多不能超过8s,但断句也不要太散太短。根据标注经验,每个自然语言段平均在5-6秒左右即可。• 单字或者两个字的叠加(如:好,嗯,行,好的),声音较小,不影响主要说话人内容,那么可以不标叠加,直接写主要说话人的内容就行了。在说话人说话的过程中,如果背景中有噪音,则需标注噪音符号,音乐早已标注MUSIC、其他人声噪音标注NOISE。如:我们是最好的朋友NOISE在背景是人发出的噪音的情况标注NOISE,整条有电流声或非人声的底噪不用加NOISE 比如说话的同时有另一个人咳嗽声和语音重叠了就标NOISE如果主说话人的声音重叠了舍弃 • 英文:(英文都是小写)只有符号英文是大写!【单词】对于语音中简单的英文单词,在能听懂的情况下,直接标出即可。例如:“网址是三w点sina点com”;“二三八幺八三二at qq点com”(不要写这个@)“请以井号键结束”;(不要写这个#) 【字母】每个字母中间用空格隔开。例如:单词读音,g o o d则表示字母读音;例如:我的编号是f m s幺三二;• 语气词除了“诶”其他的语气词都是带口字旁的汉字标注。如果发音是表示应答的“嗯”,统一都用“嗯”,不要用“恩”或者“厄”。比如哦,啊,诶等.除[G]表示整句舍弃外,其他无任何符号,遇到噪音,直接空置,不标注即可。如遇到系统播报音,请用此方式标注,欢迎致电中国保险TTS标注10分钟请点击一次临时保存,并刷新网页!如果停顿有0.5秒了,前后语音就要断开截取关于噪音:1、 一个人说了一句话,是连续没有停顿的,但一半有需要标噪音符号的一半不需要标噪音符号的,合一条截取且标噪音符号2、 若突发噪音与语音很近的话,不能截取突发噪音,从突发噪音后面开始截取,如果是底噪的话就可以正常前后预留了,如下图,红框里的是一个咳嗽声,这种情况下就不要0.3秒的预留了,咳嗽声切出去 3、 如果主说话人与旁听人员的语音重叠了,主说话的声音很大,旁听人的声音特别小的,就是有人在旁边一直小声的说话这样的当做背景人声,这属于环境背景人声,加NOISE原文件下载magic-talking标注规范-20180321.docx

热门文章

滴滴语音标注规则要求及视频教程
一、标注环境1. 请使用谷歌浏览器进行标注。2.标注平台地址:http://label.xiaojukeji.com/labelerTaskList二、标注内容1. 语音有效性标注无效语音请在有效性一项选择“无效”,并在标注文本一项标注大写字母“NULL”。有效语音请在有效性一项选择“有效”。当语音出现下列任意一种情况,即可标注为无效语音:1) 说话人声音极小,小到几乎听不到。2) 整段语音均为静音。3) 整段语音均为噪声、音乐声、导航音、广播等。4) 整段语音只有一个字,或是同一个字重复出现。如:“嗯”、“对”、“对对对对”、“啊”、“喂”、“拜拜”、“谢谢”、“好好好”、“OKOK”等。(注意:“哇噻”属于特例,单独出现时也是无效的。)5) 背景噪声大于说话人声音,或噪声与说话人声音几乎一样大。6) 整句都是方言、外语。方言是指发音与普通话区别较大的地方话,如:粤语、上海话等。7) 语音中出现地点、地名、街道名等方位词,但是地图中搜索不到。8) 语音中有大于等于两个人说话,除主说话人以外,其余人的声音清晰可辨。9) 语音中有大于等于3个字听不清楚。 2. 语音文本标注1) 语音文本内容将说话内容写成文字。要求转写的文本内容必须和听到的语音完全一致,不能多字、少字。a) 除空格、占位符号、以外,标注文本不允许使用标点符号,不允许换行。b) 说话人犹豫、口吃导致出现重复的字也要标注出来,重复了几次就标记几个。如发音为:我是北北京人;“北”字有重复现象。转写文本应为:我是北北京人c) 儿化音不需要标注出“儿”字。如发音为:我在/zher4/。转写文本应为:我在这d) 语音中提及地名、街道名、车牌号等内容,转写时需符合日常习惯。选用“路”、“街道”、“门”、“座”、“桥”等地名常用字以及“京”、“津”、“冀”等车牌号常用字。e) 语音中提及地名、街道名、店铺名、专有名词,需要准确转写。可根据读音在地图中查找,确实存在该地点则进行准确标注,搜不到则无效;f) 语音中确实听不清楚的个别单字,用占位符号【~】标记。一组【~】符号代表一个字。在整段语音中,最多只能有两组【~】符号。若有三个字或更多听不清楚,则标注为无效。(见“语音有效性标注”第8条)g) 语音中不涉及地名、专名的部分,若发音清晰但文字不确定,可以用同音字标注,要求标注用字的声韵调与实际发音完全一致。如发音为:我姓/zhang1/。标注成“我姓张”或“我姓章”都算正确。h) 数字要写成汉字形式,注意区分“一”和“幺”、“二”和“两”,按实际读音写。i) 英文字母要转写成大写字母。j) 音频中说话人清楚说出的语气词,如“呃、啊、嗯、哦、唉、呐、呢”等,要按照正确发音进行转写。语气词除了“了、不”没有口字旁,其他基本上都有口字旁。注意:语气词“唉”、“诶”不分的,统一用“唉”。 3.语言情况标注1)语音中全部内容均为中文,请选择“中文”。2)只要语音中含有英文,不论是单个字母还是单词、不论出现的数量有多少,都需要选择“英文”并且字母全部大写。1、遇到英文单词和英文字母都需要用英文大写形式表现。例如:SORRY SORRY我现在在阜成路麻烦你掉个头2、单词与单词之间加空格 。例如:我把我的APPLE SEVEN PLUS落在了车上麻烦师傅还给我一下3、字母与字母之间加空格。例如:我下了好几回这个A P P了但是怎么安装都是失败的请问客服我该怎么办4、英文单词或者英文字母与汉字之间不需要空格。例如:我的车牌号的京A三六七八5、特殊字:对于OK这一类常用词,默认为一个单词,尽管是拼读成字母发音的。对于无从适配上述规则的及时与我们沟通 4. 说话人性别标注按说话人的音色实际情况进行标注。若无法明确区分男女,不论是成人还是儿童,都标注为“女”。三、标注常见问题总结1. 短句如何判断有效性?答:短句只要有大于或等于两个不重复的音节,即为有效。例如“嗯好的”、“明白”、“可以”等。 2. 有明显口音,但能听懂,需要标注吗?答:口音但不影响理解的,音频中个别几个字的方言可以使用同音字标注。听不清音节的方言也无法使用同音字标注的,可以使用【~】,大于或等于三个字需使用【~】符号的情况下。参照“语音有效性标注”第8条规则,标记为无效。 3. 标注时有的口音能听懂,是按听的音来标注还是按普通话来标注,标注需要符合现实逻辑吗?答:一般情况下口音按实际发音来标注。以下情况请特别处理:常用词语和专有名词需按现实逻辑标注(如:发音是“现/xian4/生”标为“先生”,“滴滴专/ce1/”标为“滴滴专车”等等) 5. 音频中一串数字如【12531】转写为一二五三一还是吆二五三吆?答:转写的文本要和语音实际读法完全一致。若读为yi1,则写一;读为yao1,则写幺。同理,“二”、“两”、“俩”;“三”、“仨”也需要区别使用。 6. 一段很短的音频中语速过快,有时候听起来像三个字又像两个,是不是都能判断合格?答:短音频且内容无法听清的情况下,标记为无效。长音频中很小的一部分,无法确定内容时,参照“语音文本内容”下f项、【~】符号使用规则进行。 7. 一段音频中语速过快,能听清某些音节但大多部分不能做出准确判断写不出是否可以判断无效?答:判断为无效 8. 一段音频中出现导航仪发出的声音或者只有导航仪的声音算噪音吗?答:整段只有导航音,标记为无效。只有一部分出现导航音的时候,看声音大小,如果与说话人音量接近或者大于说话人声音,标记为无效。 注意:如果一句话里面只说了几个字方言,其他都是带口音的普通话,不要直接标无效,那全方言的字按听到的音来标,比如:说的是上海话gege,就标成“葛个”,而不是标成“那个”。语气词无法转写的可以找同音字或相近音字转写;全方言无效 关于地点、地名、街道名等方位词,这些词我们需要使用地图搜索引擎搜索如果地点、地名、街道名等词语很长且词发音很清晰,但使用地图搜索引擎搜索不到这个地点。即使这句话其他部分可以完整的转写出来,但依旧视为无效。二、关于英文转写原规范为:英文字母要转写成大写字母。        细化:1、遇到英文单词和英文字母都需要用英文大写形式表现。例如:SORRY SORRY我现在在阜成路麻烦你掉个头2、单词与单词之间加空格 。例如:我把我的APPLE SEVEN PLUS落在了车上麻烦师傅还给我一下3、字母与字母之间加空格。例如:我下了好几回这个A P P了但是怎么安装都是失败的请问客服我该怎么办4、英文单词或者英文字母与汉字之间不需要空格。例如:我的车牌号的京A三六七八5、特殊字:对于 OK 这一类常用词,默认为一个单词,尽管是拼读成字母发音的。对于无从适配上述规则的,我们及时向海瑞提出。三、噪音符号这部分,这部分依旧不用添加。 四、关于标普、方普、方言如何转写    1、标普:就是普通话,我们是一定要转写的。    2、方普:就是方言普通话,例如广州人说普通话,上海人说普通话,天津人说普通话等等,这些是需要转写的。只是他们在说普通话的时候会有一些口音。例如发音说:我现在湖南(fu2声 lan2声)长沙市中心你来接我一下     他说的是“fu lan”我们正常书写成“湖南”即可。    3、方言:直接视为无效即可,例如:粤语、上海话、江苏话等等。