<aside> 💭 想来捡一捡,看看一年后的自己能不能从中提取一篇论文
</aside>
目前拥有标注数据6386条, 隐式毒性3535条, 显式毒性523条, 无毒数据2328条. 用户总数5577(爬到了3970个人的信息), 包含有hashtag的有4968条, 不同的hashtag有2205
<aside> 🙃 这个文档里有一些不太能用的基本特征
</aside>
利用LIWC词库计算词频与相关性
对发布者而言
负向情绪词和正向情绪词明显分布不同
情绪副词增多, 正向情绪词增多不明显
情绪副词增多, 负向情绪词增多明显
对热搜而言