标签:智能语音
chatterbot是一个开源中文对话语料库,语言库数量为560,已按类型进行分类。
CHIME是用于语音识别挑战赛(CHiME Speech Separation and Recognition Challenge)的数据集。该数据集包含了训练集、开发机、测试集三部分,每份里面包括了多个扬声器在不同噪音环境下的数据。
Microsoft Cognitive Toolkit (CNTK), an open source deep-learning toolkit
包括文本和语音的有声读物数据集。它是近 500 小时由多人朗读清晰的各类有声读物数据集,且由包含文本和语音的书籍章节组织起结构。