关于诸如堕胎合法化、女权主义、希拉里·克林顿等各种左倾问题的推文,如果所述推文对该问题赞成、反对或保持中立,则将其分类(600 KB)
包含从1951年到2014年的经济新闻,可根据新闻报道判断该文章是否与美国经济情况相关,如果是,报道的基调是什么(12 MB)
预测有人会喜欢哪些博客文章。包含博客文章、元数据、用户喜欢情况等信息(1.5 GB)
2000个人,共163446幅人脸图像(年龄识别)
样例数据文件是txt格式,每行一条数据,每条数据是一个(实体名称,属性名称,属性值)的三元组,中间用tab分隔,具体如下所示。
带口音的语音清洁数据集,特别是对于如期望对不同口音或腔调的语音有鲁棒性需求的系统很有用。
10575个人,共49414幅人脸图像
截至2015年7月的每个公开可用的书签评论,共计17亿条评论(250 GB)
并行语料库训练数据(612 MB) md5 sha1
5749个人,共13233幅人脸图像
荷兰语,该语料库包含两种类型的学生文本:作文和评论。涉及作者(性别、年龄、性取向、来源地区、性格概况)和文档(时间、流派、真实性、情绪、等级)等大量元数据。由安特卫普大学CLiPS研究中心提供,主要用于计量文体学分析。
包含从各种在线沙特报纸中摘录的31,030份阿拉伯文报纸文章及其元数据(2 MB)
下载获取 YAGO 源代码访问GitHub 上的 YAGO 源代码。下载整个 YAGO您可以一次性下载整个 YAGO(3.1 版)本体。不同转储的时间戳如下:维基百科(en、de、nl、fr、it、es、pl、fa、ar、ro):2017-05-20地名:2017-06-18维基数据:2017-05...
包含216,930个危险问题(53 MB)
50个人,每个人24段视频
The WebVision dataset is designed to facilitate the research on learning visual representation from noisy web data.
维基媒体基金会提供的完整副本,以wikitext源代码和嵌入XML的元数据形式提供(500 GB)
180幅图像,共734个人脸。包含3个正面人脸测试子集和一个旋转人脸测试子集,其中正面人脸测试子集有130幅图像,共511个人脸;旋转人脸测试子集有50幅图像,共223个人脸。
1595个人,共3425段视频
The Open Images dataset