发布人:点我
项目名称:粤语采集226句采集+标注
发布时间:2020-02-07
标注公司:点我科技
标注类型:道路标注
项目周期:6个月
结算方式:不限
签订合同:不限
显示方式:未显示
项目要求:需要广州、韶山、汕头226句粤语采集,加标注 226其中,60句录三遍,剩下部分录两遍,录完标注, 1, 请朗读者预览整个关键词列表。 请让他们先行朗读列表,如果条件允许则大声朗读,这样他们能熟悉列表。 2, 要求朗读者戴上耳麦调整麦克风到距离嘴部1.5厘米处。 如果麦克风放得太远或太近,录音质量将会受到影响。 让朗读者阅读几个关键词,以便她/他熟悉耳麦。 打开软件 “Audacity” (可在此下载: http://www.audacityteam.org/)。 3, 选择左下角的采样率(“Project Rate”)为16000。开始录制(通过单击左上角的红色圆形按钮)。 要求朗读者以干净,清晰,平坦和平静的声音阅读完整的关键词列表。 请朗读者不要考虑词语的情节,假设他们正在阅读一本稍显乏味的书。 ●普通话和方言不要相互穿插,坚持使用一种 ●请说话者想象是在在一个相对安静的房间里和坐在你旁边的人说话 ●不要改变短语顺序 ●在每个短语之间暂停(1~2秒) ●这一阶段的重点是正确记录短语的发音。 所以说得稍慢,并正确地发音。 但不要说的太慢,以至于不自然 ●如果有明显的错误,请从关键词列表的开始重新尝试(重新开始一段新录音) 4, 停止录制,将音频文件保存在data/普通话/FXXX/calm/phrase下(“普通话”处填写语种,F代表女性,M代表男性,XXX是演讲者的数字编号)。 单击“文件” - >“导出音频”。 从弹出窗口右下方列表中的选项’中选择文件类型为“WAV 32位浮点PCM”(“WAV 32-bit float PCM”)。 输入文件名为FXXX。 单击“保存”后,单击以下窗口中的“确定”。 5, 选择左下角的采样率(“Project Rate”)为16000。开始录音。 请朗读者重新朗读完整的关键词列表。 这次让他们在词语的情景中朗读。 ●普通话和方言不要相互穿插,坚持使用一种 ●不要改变短语顺序 ●在每个短语之间暂停(1~2秒) ●不要说得太快,避免跳字或者吐字不清 ●控制说话音量,不要大喊,不要朝着麦克风吹气,尽量保持均匀的音量,说话尽量不要比上一次录音更响 6, 停止录制,将音频文件保存在data/普通话/FXXX/emotional/phrase下(“普通话”处填写语种,F代表女性,M代表男性,XXX是演讲者的数字编号)。 单击“文件” - >“导出音频”。 从弹出窗口右下方列表中的选项’中选择文件类型为“WAV 32位浮点PCM”(“WAV 32-bit float PCM”)。 输入文件名为FXXX。 单击“保存”后,单击以下窗口中的“确定”。 7, 请朗读者预览整个句子列表。请让他们先行朗读列表,如果条件允许则大声朗读,这样他们能熟悉列表。 8, 选择左下角的采样率(“Project Rate”)为16000。开始录制(通过单击左上角的红色圆形按钮)。 要求朗读者以干净,清晰,平坦和平静的声音阅读完整的句子列表。 请朗读者不要考虑词语的情节,假设他们正在阅读一本稍显乏味的书。 ●普通话和方言不要相互穿插,坚持使用一种 ●请说话者想象是在在一个相对安静的房间里和坐在你旁边的人说话 ●不要改变句子顺序 ●在每个句子之间暂停3秒或以上(朗读时句子里的停顿不要超过3秒) ●这一阶段的重点是正确记录短语的发音。 所以说得稍慢,并正确地发音。 但不要说的太慢,以至于不自然 ●如果有明显的错误,请从关键词列表的开始重新尝试(重新开始一段录音) ●录音中间暂停1到3次,以便让朗读者休息一下。 记录下暂停时朗读到的句子和音频文件里的时间点 ●如果有明显错误,请重新朗读整个句子。 每次重复,记录下重复的句子和录音中的时间点。 9, 停止录制,将音频文件保存在data/普通话/FXXX/calm/utterance下(“普通话”处填写语种,F代表女性,M代表男性,XXX是演讲者的数字编号)。 单击“文件” - >“导出音频”。 从弹出窗口右下方列表中的选项’中选择文件类型为“WAV 32位浮点PCM”(“WAV 32-bit float PCM”)。 输入文件名为FXXX。 单击“保存”后,单击以下窗口中的“确定”。 10, 选择左下角的采样率(“Project Rate”)为16000。开始录音。 请朗读者重新朗读完整的句子列表。 这次让他们在词语的情景中朗读。 ●普通话和方言不要相互穿插,坚持使用一种 ●不要改变句子顺序 ●在每个句子之间暂停3秒或以上(朗读时句子里的停顿不要超过3秒) ●不要说得太快,避免跳字或者吐字不清 ●控制说话音量,不要大喊,不要朝着麦克风吹气,尽量保持均匀的音量,说话尽量不要比上一次录音更响 ●录音中间暂停1到3次,以便让朗读者休息一下。 记录下暂停时朗读到的句子和音频文件里的时间点 ●如果有明显错误,请重新朗读整个句子。 每次重复,记录下重复的句子和录音中的时间点。 11, 停止录制,将音频文件保存在data/普通话/FXXX/emotional/utterance下(“普通话”处填写语种,F代表女性,M代表男性,XXX是演讲者的数字编号)。 单击“文件” - >“导出音频”。 从弹出窗口右下方列表中的选项’中选择文件类型为“WAV 32位浮点PCM”(“WAV 32-bit float PCM”)。 输入文件名为FXXX。 单击“保存”后,单击以下窗口中的“确定”。 12, (是一个建议步骤,但如果朗读者在录制句子时出错,建议在录制后立即完成)打开两个句子的录音,标记有效录音内容的开始时间和结束时间,以及朗读句子中间停顿休息的时间。这些笔记有助于之后音频的截取。 ●句子起止标记尽量在句子间隔的中间,不要标记到句子或短语上去 ●如果在录制过程中没有出错,可以通过在Audacity上显示波形来完成标记。 先导出音频(保存)并重新打开导出的音频,以避免修改录音。 寻找具有小振荡或无振荡且持续时间为1秒或更长的区域。 您可以通过单击该位置附近的波形来读取时间点,时间点会显示在界面底部的“音频位置”(“Audio Position”)处 ●如果录制过程出错,请标出无效(出错)区域的开头和结尾。标记时请播放文件以确保标记对齐。 您可以通过在Audacity上单击波形任意位置播放那个时间点的音频,先选定时间点然后单击左上角的圆形“播放”按钮 ●请尽量避免在标记中漏掉或插入额外的暂停。 一个标记错位之后的所有短语/句子都会错位。必要时可以播放一下后面的语音来确定没有错误 ●标记文件应保存在名称为“FXX.txt”的同一目录下,使用以下格式(需要在小数点后右边只有1个数字,例如00h01m01.154s可以保存为1.01.2; 四舍五入到最接近的数字): *开始时间* *第一个短暂停* 1 *第二个短暂停* 2 *错误开始* MS *错误结束* ME *第三个短暂停* 3 …. *结束时间* E.g.: 13.1 14.5 1 15.7 2 18.2 MS 22.9 ME 24.1 3 …. 3.13.4 13, 截取音频。请将每个句子和每十个关键词截成一个单独的音频文件。 ●在Audacity中打开完整音频,在波形图要截取的开始按下鼠标左键从左到右拖拽至要截取部分的结尾释放鼠标左键。截取的部分波形图会变成高亮。点击Audacity上部剪刀按钮右边的复制按钮(“Copy”)。打开一个新Audacity窗口然后单击Audacity上部复制按钮右边的粘贴按钮(“Paste”),保存音频(单击“文件” - >“导出音频”,使用WAV 32位浮点PCM保存)。 ●截取的关键词文件命名为“data/FXXX/calm/phrase/FXXX_01_10”或者“data/FXXX/emotional/phrase/FXXX_01_10”(其中“01_10”表示是第1到第10个关键词) ●截取有错误的句子录音时请参考第12步中的笔记,不要将错误的部分遗留在截取后的音频里 ●截取的句子文件命名为“data/FXXX/calm/utterence/FXXX_01”或者“data/FXXX/emotional/utterence/FXXX_01”(其中“01”表示是第1个句子) ●如果录音包含错误,请播放错误部分前后的音频以确保截取记正确。 ●(很重要)请另一个人(务必与截取者不同)播放音频检查截取关键词和句子的文件无误。务必检查关键词的音频以确保首关键词和尾关键词符合文件名