ICWSM 2017论文“自动仇恨语音检测和无礼语言问题”的作者贡献。包含3类短文本:a)包含仇恨言论;b)是冒犯性的,但没有仇恨言论;c)根本没有冒犯性。由15,000行文本构成,每个字符串都经过3人判断(3 MB)
来源: Automated Hate Speech Detection and the Problem of Offensive Language
原文链接: https://github.com/t-davidson/hate-speech-and-offensive-language