包含n-gram表示形式,这些数据可以作为查询重写任务的测试平台,这是IR研究中的一个常见问题,也是NLP研究中常见的单词和句子相似性任务(2.6 GB)
来源: Yahoo! N-Gram Representations
原文链接: https://guce.oath.com/collectConsent?brandType=nonEu&.done=https%3A%2F%2Fwebscope.sandbox.yahoo.com%2Fcatalog.php%3Fdatatype%3Dl%26guccounter%3D1&ccSessionId=2_cc-session_ed5aeab2-0498-4c66-b7d0-36b372277a39&lang=&inline=false