全部 - 青少年人工智能资源与创新平台 - 互联网教育智能技术及应用国家工程实验室 - Powered By EduSoho

标签：语音识别

18

11月

AISHELL开源版

AISHELL是一个中文语音数据集，其中包含178小时的开源版数据。该数据集包含400个来自中国不同地区、具有不同的口音的人的声音。录音是在安静的室内环境中使用高保真麦克风进行录音，并采样降至16kHz。通过专业的语音注释和严格的质量检查，手动转录准确率达到95％以上。该数据免费供学术使用。

18

11月

THCHS30

THCHS30是由清华大学语音与语言技术中心发布的开源中文语音数据集。数据集包含了1万余条语音文件，大约40小时的中文语音数据，内容以文章诗句为主，全部为女声。THCHS-30是在安静的办公室环境下，通过单个碳粒麦克风录取，采样频率16kHz，采样大小16bits。

18

11月

AudioSet

谷歌发布的大规模一品数据集，AudioSet 包括 632 个音频事件类的扩展类目和从YouTube视频绘制的 2084320 个人类标记的10秒声音剪辑的集合。类目被指定为事件类别的分层图，覆盖广泛的人类和动物声音，乐器和风格以及常见的日常环境声音。

18

11月

TIMIT

TIMIT是一份英文语音识别数据集，包含630个扬声器的宽带录音，八个主要方言的美式英语，每个阅读十个语音丰富的句子。TIMIT语料库包括时间对齐的正字法，语音和单词转录以及每个话语的16位，16kHz语音波形文件。

01

12月

CHIME

CHIME是用于语音识别挑战赛（CHiME Speech Separation and Recognition Challenge）的数据集。该数据集包含了训练集、开发机、测试集三部分，每份里面包括了多个扬声器在不同噪音环境下的数据。

19

12月

诗词模仿诵读评分

对诗词的学习和赏析，除了知识点之外，能够有情感地诵读也是重要的部分。诗词诵读能力的培养有很多途径，其中模仿诵读最为简单。在进行模仿诵读练习的过程中，如果能够通过专家一对一的反馈和指导，诵读能力能够快速提升。如何在没有专家人工辅导的情况下，通过人工智能的方式提高诵读能力，是一个值得探索的问题。挑战：开...

19

12月

唐诗知识问答

央视节目《中国诗词大会》用耳熟能详的诗词，让传统文化“热”了起来。古诗词是中华文明璀璨的明珠，是汉语水平发展的精华之作，而且诗词的考核在语文教学中占有重要地位。挑战：开发一个系统，能够理解提问者对于唐诗的问题（例如某首唐诗的作者是谁、作者的出生日期等），并将问题结果通过语音的方式反馈给提问者。数据集...

03

12月

annyang

Speech recognition for your site

03

12月

tensorflow-speech-recognition

tensorflow-speech-recognition

Speech recognition using the tensorflow deep learning framework, sequence-to-sequence neural networks

02

12月

Automatic_Speech_Recognition

End-to-end Automatic Speech Recognition for Madarian and English in Tensorflow

02

12月

speech-to-text-wavenet

Speech-to-Text-WaveNet : End-to-end sentence level English speech recognition based on DeepMind's WaveNet and tensorflow

02

12月

music-source-separation

Separating singing voice from music based on deep neural networks in Tensorflow

02

12月

dejavu

Audio fingerprinting and recognition in Python

02

12月

pyAudioAnalysis

Python音频分析库：特征提取，分类，分段和应用

02

12月

speech_recognition

Speech recognition module for Python, supporting several engines and APIs, online and offline.

02

12月

deep-voice-conversion

Deep neural networks for voice conversion (voice style transfer) in Tensorflow

02

12月

librosa

Python library for audio and music analysis

02

12月

DeepSpeech

A TensorFlow implementation of Baidu's DeepSpeech architecture

02

12月

deepvoice3

Tensorflow Implementation of Deep Voice 3

01

12月

自然语言处理

Densely-Interactive-Inference-Network

Cleaned code for paper "Natural Language Inference over Interaction Space"