Skip to content

Latest commit

 

History

History
7 lines (4 loc) · 391 Bytes

210617 WaveGrad 2.md

File metadata and controls

7 lines (4 loc) · 391 Bytes

https://arxiv.org/abs/2106.09660

WaveGrad 2: Iterative Refinement for Text-to-Speech Synthesis (Nanxin Chen, Yu Zhang, Heiga Zen, Ron J. Weiss, Mohammad Norouzi, Najim Dehak, William Chan)

포님2웨이브 tts. 최신 유행에 맞게 스코어 기반 모델을 활용했습니다. mos는 괜찮아 보이는데 rtf가 문제군요. 50 이터레이션 정도는 돌아야 하므로.

#tts