Introduction
- 个性化翻译的挑战:
- 自然语言中语言风格和语义通常交织在一起,因此建立这样的机器翻译模型具有挑战性。
- 能体现语言风格的数据比较少。
- 不同内容对个性化的需求不同。
- this paper: (1)利用UGTC;(2)Transformer 先通用翻译,再转换风格;(3)以微博为例,提出原型(4)在评估中增加可理解性
Model

Evaluation
3个月获得了2217006个post, 属于4587个用户,只考虑用户公开发表的帖子
删除字数少于10的, 转发的,剩余1135427个post, 3446个用户
过滤活动度较低的用户(发帖数少于50的)→ 1128327个post, 3256个用户
选择1000个用户, 352516个post, 每一轮添加100个用户,发现结果没有变化,从而说明1000个用户已经收敛
Platform-based analysis
用biLSTM分类微博平台的语言和一般翻译的语言是否有区别
User-based analysis
一般翻译跟某个用户之间的差异
Automatic Evaluation Metrics and Results
Human Evaluation
