全部 - 青少年人工智能资源与创新平台 - 互联网教育智能技术及应用国家工程实验室 - Powered By EduSoho

标签：人工智能

01

12月

经济新闻报道的基调和相关性

包含从1951年到2014年的经济新闻，可根据新闻报道判断该文章是否与美国经济情况相关，如果是，报道的基调是什么（12 MB）

01

12月

GigaOM Wordpress Challenge [Kaggle]

预测有人会喜欢哪些博客文章。包含博客文章、元数据、用户喜欢情况等信息（1.5 GB）

01

12月

CACD2000

2000个人,共163446幅人脸图像(年龄识别)

01

12月

CN-DBpedia Dump数据集

样例数据文件是txt格式，每行一条数据，每条数据是一个(实体名称，属性名称，属性值)的三元组，中间用tab分隔，具体如下所示。

01

12月

VoxForge

带口音的语音清洁数据集，特别是对于如期望对不同口音或腔调的语音有鲁棒性需求的系统很有用。

01

12月

CASIAWebFace

10575个人,共49414幅人脸图像

01

12月

Reddit评论

截至2015年7月的每个公开可用的书签评论，共计17亿条评论（250 GB）

01

12月

欧洲语言机器翻译

并行语料库训练数据(612 MB) md5 sha1

01

12月

LFW

5749个人,共13233幅人脸图像

01

12月

CSI语料库

荷兰语，该语料库包含两种类型的学生文本：作文和评论。涉及作者（性别、年龄、性取向、来源地区、性格概况）和文档（时间、流派、真实性、情绪、等级）等大量元数据。由安特卫普大学CLiPS研究中心提供，主要用于计量文体学分析。

01

12月

SaudiNewsNet

包含从各种在线沙特报纸中摘录的31,030份阿拉伯文报纸文章及其元数据（2 MB）

01

12月

YAGO

下载获取 YAGO 源代码访问GitHub 上的 YAGO 源代码。下载整个 YAGO您可以一次性下载整个 YAGO（3.1 版）本体。不同转储的时间戳如下：维基百科（en、de、nl、fr、it、es、pl、fa、ar、ro）：2017-05-20地名：2017-06-18维基数据：2017-05...

01

12月

Jeopardy

包含216,930个危险问题（53 MB）

01

12月

Replay-Attack2012

50个人,每个人24段视频

01

12月

webvision

The WebVision dataset is designed to facilitate the research on learning visual representation from noisy web data.

01

12月

维基百科XML数据

维基媒体基金会提供的完整副本，以wikitext源代码和嵌入XML的元数据形式提供（500 GB）

01

12月

CMU+MIT

180幅图像,共734个人脸。包含3个正面人脸测试子集和一个旋转人脸测试子集,其中正面人脸测试子集有130幅图像,共511个人脸;旋转人脸测试子集有50幅图像,共223个人脸。

01

12月

YouTube 2011

1595个人,共3425段视频

01

12月

dataset

The Open Images dataset

01

12月

Event Registry

可以实时访问全球100,000个新闻源的新闻文章，有API（免费查询工具）