<aside>
💭 想来捡一捡,看看一年后的自己能不能从中提取一篇论文
</aside>
🎯Target
- COLING:https://coling2025.org/
- direct ddl 2024.9.16
- ARR ddl 2024.10.20
- 小微
📰Now Research
相关工作
Hate Speaker
数据情况
目前拥有标注数据6386条, 隐式毒性3535条, 显式毒性523条, 无毒数据2328条. 用户总数5577(爬到了3970个人的信息), 包含有hashtag的有4968条, 不同的hashtag有2205
<aside>
🙃 这个文档里有一些不太能用的基本特征
在线社区毒性语言相关因素探索
</aside>
标注相关
标注指南
标注确认会议
分类器结果
情绪相关分析
利用LIWC词库计算词频与相关性
LIWC特征统计
-
对发布者而言
- 隐式毒性发布者的历史数据中表达负向情感的词语比无毒用户多。
- 情绪副词与负向情感词共现中隐式毒性发布者更多,而无毒发布者的情绪副词与正向情感词的共现情况

负向情绪词和正向情绪词明显分布不同

情绪副词增多, 正向情绪词增多不明显

情绪副词增多, 负向情绪词增多明显
-
对热搜而言
🗑️没什么用的bak
可解释文本分类
微博社区协同隐式毒性检测