标签:计算思维
所有归档的论文全文(270 GB)+源文件(190 GB)
533对亲属关系(KFW-I)和1000 对亲属关系(KFW-II)
RDF数据RDF 转储首先,可以在https://dumps.wikimedia.org/wikidatawiki/entities/下找到使用Turtle和NTriples格式的规范 RDF 转储。此处描述了映射。这些完整的陈述被标注为所有。其次,提供所谓的真实转储。他们使用nt格式。它们的格式与...
包含n-gram及其观察到的频率计数。n-gram的长度从unigrams(单个单词)到5-gram,主要用于统计语言建模(24 GB)
英文维基百科的处理转储(66 GB)
关于诸如堕胎合法化、女权主义、希拉里·克林顿等各种左倾问题的推文,如果所述推文对该问题赞成、反对或保持中立,则将其分类(600 KB)