Introduction

开源社区中,贡献者的PR可能被不公平的对待,从而产生了conflict,

当前研究了潜在的危害,没有研究如何管理 conflict && disagreement

本文研究了3种管理策略:

  1. rational explanation:调节,谈判,解释清楚误会等
  2. constructive suggention:Problem Solving,给出双赢做法
  3. social encouragement:尽量不让贡献者anger或者frustration

Hypotheses

Method

数据收集

随机选取了170个project(每个repo有1000+的fork, 和100+的PR,98.2%的repo仍然开放PR)的root repo, PR, review comment, 一共有196037的PR, 61.6%是通过的

构建数据集

选5000个PR(包含贡献者 comments),标注这个comment是否是argument。选1000条进行标注,在贡献者argue之后,评论中是否包含三种策略,包含哪三种策略(可能包含多种)。

训练分类器(SVM, LDA?)

  1. 是否为argument
  2. 是哪一种管理策略

分析与结果

Propensity score matching(PSM)

Survival Analysis(Cox proportional-hazard regression)

使用这个是因为标准的regression模型 do not take into account censored observation?

Untitled