Board
[ ] 单模态
探究拼音之间的特征, 以及fastspeech2哪一部分特征更适合分类
[ ] 语音(无预训练)mel→lstm→label
[ ] 语音(无预训练)features→lstm → label
[ ] 文本bert→label
[ ] 预训练(为了使得模型声调不敏感)
FastSpeech2