源于Quora 的包含重复/语义相似性标签的数据集。数据集由超过40万行的潜在问题的问答组成。每行数据包含问题ID、问题全文以及指示该行是否真正包含重复对的二进制值。
来源: Question Pairs
原文链接: https://data.quora.com/First-Quora-Dataset-Release-Question-Pairs
源于Quora 的包含重复/语义相似性标签的数据集。数据集由超过40万行的潜在问题的问答组成。每行数据包含问题ID、问题全文以及指示该行是否真正包含重复对的二进制值。
来源: Question Pairs
原文链接: https://data.quora.com/First-Quora-Dataset-Release-Question-Pairs