用谷歌浏览器,鼠标拖动截取分段,内容右键,选择符号
爱数这个任务非常简单,很好做,需要的看下文档
1、需要根据说话人变化切换说话人,角色根据出场前后顺序标注
2、根据说话人内容进行转写,不得漏字、错字、多字
3、严重方言允许舍弃,带口音的普通话请尽量转写。
4、在说话人说话的过程中,如果背景中有噪音,则需标注噪音符号,音乐早已标注MUSIC、其他人声噪音标注NOISE。
5、如果两个说话人同时说话的,允许丢弃两个人同时说话的部分,但一个人说话的地方请保留。
(不要断句太散,如果句子中有一个字听不懂的,请联系前后语境,推测出最可能的字,尽量整句标注)
一 时间边界定位:
• 用鼠标选中波形,即为要标注的一段时间边界,此时会自动跳出对应的编辑框
图中的红蓝方框即为选中一段需要标注的时间边界。
• 听音,在整段电话语音的基础上,根据语义和停顿时间等因素,在音频信号中每一句话的句首和句尾分别添加时间边界。即,一段标注框内,即为一段标注的话。
• 每段前后需预留0.3s的空白段,但在没有可预留空白的情况下,不做预留,同理,叠加也不做预留,仅是说话段、并且能有前后留白的地方预留0.3s。
二 文件标注:
•
• 此处主要标注语音文件的一些全局信息,包括说话人性别信息和语种信息(方言区)。标注时请按照实际情况选择。
• 关于说话人的选择,客服标注奇数,用户标注偶数;
• 如果第三个人的情况:
点击“+”号,即可添加。
• 编辑框内需要标注的是该句对应的文字
• 如果是汉语交谈,则只能用简体汉字。对于语音中的数字部分需根据发音情况转换为对应的汉字,例如“27”→“二十七”;“我的电话是2381832”→“我的电话是二三八幺八三二(与发音相同)”。
• 编辑框内正常语音的标注
• 如果此语段为某一个人的汉语对话语音,请在标注时间边界后,选择对应的1或者2,编辑框内输入相应的文本。
• 如果此语段为两个人交叉语音,关于重叠(交叉)的语音,即对于某个人的一句话未完,另一个人的一句话已经开始的情况:请不要标注该语段,空置就行。
• 在整个语音中,需根据说话人的变换来增加时间边界(不同说话人分段标注)。
• 如果同一说话人说话时间较长,则应根据其语义来增加时间边界,每个时间段的长度最多不能超过8s,但断句也不要太散太短。根据标注经验,每个自然语言段平均在5-6秒左右即可。
• 单字或者两个字的叠加(如:好,嗯,行,好的),声音较小,不影响主要说话人内容,那么可以不标叠加,直接写主要说话人的内容就行了。
在说话人说话的过程中,如果背景中有噪音,则需标注噪音符号,音乐早已标注MUSIC、其他人声噪音标注NOISE。如:我们是最好的朋友NOISE
在背景是人发出的噪音的情况标注NOISE,整条有电流声或非人声的底噪不用加NOISE 比如说话的同时有另一个人咳嗽声和语音重叠了就标NOISE
如果主说话人的声音重叠了舍弃
• 英文:(英文都是小写)只有符号英文是大写!
【单词】对于语音中简单的英文单词,在能听懂的情况下,直接标出即可。
例如:“网址是三w点sina点com”;
“二三八幺八三二at qq点com”(不要写这个@)
“请以井号键结束”;(不要写这个#)
【字母】每个字母中间用空格隔开。
例如:单词读音,g o o d则表示字母读音;
例如:我的编号是f m s幺三二;
• 语气词
除了“诶”其他的语气词都是带口字旁的汉字标注。如果发音是表示应答的“嗯”,统一都用“嗯”,不要用“恩”或者“厄”。比如哦,啊,诶等.
除[G]表示整句舍弃外,其他无任何符号,遇到噪音,直接空置,不标注即可。
如遇到系统播报音,请用此方式标注,欢迎致电中国保险TTS
标注10分钟请点击一次临时保存,并刷新网页!
如果停顿有0.5秒了,前后语音就要断开截取
关于噪音:
1、 一个人说了一句话,是连续没有停顿的,但一半有需要标噪音符号的一半不需要标噪音符号的,合一条截取且标噪音符号
2、 若突发噪音与语音很近的话,不能截取突发噪音,从突发噪音后面开始截取,如果是底噪的话就可以正常前后预留了,如下图,红框里的是一个咳嗽声,这种情况下就不要0.3秒的预留了,咳嗽声切出去
3、 如果主说话人与旁听人员的语音重叠了,主说话的声音很大,旁听人的声音特别小的,就是有人在旁边一直小声的说话这样的当做背景人声,这属于环境背景人声,加NOISE
原文件下载
magic-talking标注规范-20180321.docx