包含从原始电影脚本中提取的虚构对话集:10,292对电影角色之间的220,579次会话交流、涉及617部电影中的9,035个字符,共304,713个句子。元数据极其丰富,包含流派、发布年份、IMDB评级、IMDB票数、性别、在电影积分榜上的位置。
来源: Cristian Danescu-Niculescu-Mizil
原文链接: http://www.cs.cornell.edu/~cristian/Cornell_Movie-Dialogs_Corpus.html
包含从原始电影脚本中提取的虚构对话集:10,292对电影角色之间的220,579次会话交流、涉及617部电影中的9,035个字符,共304,713个句子。元数据极其丰富,包含流派、发布年份、IMDB评级、IMDB票数、性别、在电影积分榜上的位置。
来源: Cristian Danescu-Niculescu-Mizil
原文链接: http://www.cs.cornell.edu/~cristian/Cornell_Movie-Dialogs_Corpus.html