语音任务最新标注规则 1. 所有唱歌、唱戏等形式的语音内容无意义。例:山东快书、京韵大鼓、RAP、人在轻唱等。 2. 单独一个字、字母、人名时无意义,例:A、都、牛、小张、李晓晓等无意义。 3. 单独的问候语无意义,例:早上好、晚安、你好、你好吗、你们好、谢谢、再见等。 4. 单独的问候语所对应的英文无意义,例:hello 、byebye、 goodbye、ok等。(How are you等具有多单词组合的英文句子算有意义) 5. 单独的姓名称呼类无意义,例:王大姐、王科长、老大、李先生等,(美女、老婆、帅哥等有意义。) 6. 单独的语气词无意义,例:嗯、啊、哈哈、啦啦啦等。 7. 相同无意义内容多次重复出现仍为无意义,例:你好你好、小张小张等。 8. 多个不同无意义内容组合出现仍为无意义,例:腾讯QQ、你好再见、你好小张、王晓王霞等。 9. 整段语句中只有脏话或XX人+脏话的形式为无意义。 10. 没有实际语义的话无意义,例:要去要要要直了。 11. 多人同时说话,无意义。“多人同时说话”是指两个或两个以上的人同时在说,无法听清楚他们在说什么的情况。但是多人分别说话(如两个人一先一后)是有意义的内 容,需要标注。 12. 严重的一字一顿无意义。例“你吃了吗”中间每个字间隔1秒以上无意义。(一字一顿如果出现了拖音为有意义) 13. 整段语句中同时包含男、女声说话为无意义。 本文来源:https://www.wddqw.com/doc/0e35984dc850ad02de80419e.html