https://arxiv.org/abs/2007.06162
Do You Have the Right Scissors? Tailoring Pre-trained Language Models via Monte-Carlo Methods (Ning Miao, Yuxuan Song, Hao Zhou, Lei Li)
lm을 파인튜닝하면 데이터셋이 제한적이기 때문에 분포 추정에 왜곡이 있음. 이에 대해 모델 분포와 실제 분포의 비율을 추정하고 샘플링 과정에 사용. 샘플링을 효율적으로 만들기 위해 시퀀스의 prefix에 대해 계산이 가능하도록 설계. 요즘 생성 과제에 많이 쓰이는 필터링의 개량? #language_generation