当前研究进度
定量分析:
用户身份没有结论
<aside> 💭 发布者本身的身份 会放大或者缩小毒性的传播和影响,但是跟毒性本身关系不大。
</aside>
用户历史数据:探索了情绪词与毒性的关系
问卷:主要探索隐式毒性检测及去毒工具的使用需求及设计需求
有效数据总量
标注post:共5768条,毒性3170条;无毒2128条;显式470条。
涉及用户总数:5577条,以获取信息数3970条。
关键词累计1786个
用户
用户基本特征
数据量增多之后,分布还是没有什么改变
考虑按影响力把用户分类
LIWC统计发布者其他POST
情绪词
隐式毒性语言发布者更偏向于负向情感表达
隐式毒性发布者的历史数据中表达负向情感的词语比无毒用户少。
情绪副词与负向情感词共现中隐式毒性发布者更多,而无毒发布者的情绪副词与正向情感词的共现情况
定性分析用户的期望价值目标
问卷设计,调查对象可分为受害者、发布者、管理者三类