第一次数据统计:(147条标注,10月2号以前)
‣
kappa:
每个人取50条由syy和lyq二次标注, 计算kappa:
num:
cbw chx dst lyq syy tt wd xyf yhl zq
--- ----- ----- ----- ----- ----- ---- ---- ----- ----- ----
cbw 40 0 0 40 40 0 0 0 0 0
chx 0 119 0 46 49 0 0 0 0 0
dst 0 0 120 50 50 0 0 0 0 0
lyq 40 46 50 452 429 12 50 50 50 50
syy 40 49 50 429 479 39 37 45 50 50
tt 0 0 0 12 39 39 0 0 0 0
wd 0 0 0 50 37 0 113 0 0 0
xyf 0 0 0 50 45 0 0 53 0 0
yhl 0 0 0 50 50 0 0 0 53 0
zq 0 0 0 50 50 0 0 0 0 117
toxicity:(是,否)
cbw chx dst lyq syy tt wd xyf yhl zq
--- --------- --------- --------- -------- -------- --------- --------- --------- --------- ---------
lyq 0.777778 0.378378 0.798061 1 0.596585 0.75 0.766355 0.585062 0.641148 0.851632
syy 0.717314 0.120718 0.785592 0.596585 1 0.731034 0.723192 0.657236 0.715447 0.788732
implicit:(显式,隐式,混合,无毒)
cbw chx dst lyq syy tt wd xyf yhl zq
--- --------- --------- --------- -------- -------- --------- --------- --------- --------- ---------
lyq 0.531532 0.055805 0.569954 1 0.384734 0.387755 0.369266 0.341352 0.355828 0.178532 0.353
syy 0.391226 0.152817 0.633596 0.384734 1 0.470588 0.481122 0.362778 0.472296 0.352052 0.411
其他中文数据集:
中文:
英文:
选出有争议的100条数据(tt 10, xyf:20, cbw:15, yhl: 17,wd:11,dst:10,zq:17)投票划定标准
正式标注流程: