Continuous Mask-Predict

This repository implements the experiments from "Continuous Mask Predict: Enabling Better Control for Parallel Decoding Iterative Refinement."

The code is based off of the implementation of Mask-Predict: Parallel Decoding of Conditional Masked Language Models available here.

Preprocess

text=PATH_YOUR_DATA

output_dir=PATH_YOUR_OUTPUT

src=source_language

tgt=target_language

model_path=PATH_TO_MASKPREDICT_MODEL_DIR

python preprocess.py --source-lang ${src} --target-lang ${tgt} --trainpref $text/train --validpref $text/valid --testpref $text/test --destdir ${output_dir}/data-bin --workers 60 --srcdict ${model_path}/maskPredict_${src}${tgt}/dict.${src}.txt --tgtdict ${model_path}/maskPredict${src}_${tgt}/dict.${tgt}.txt

Train

Training Continuous Mask Predict

Use the run_train.sh script to launch training jobs on the G2 cluster. For usage type:

run_train.sh --help

Training the distilled classifier

Schedule classifier training using sbatch train_classifier.sh.

AR model training

Schedule AR training using sbatch train_AR.sh.

Evaluation

Use the [run_generate.sh] script to perform evaluation. For usage type:

run_generate.sh --help

License

MASK-PREDICT is CC-BY-NC 4.0. The license applies to the pre-trained models as well.

Name		Name	Last commit message	Last commit date
Latest commit History 23 Commits
fairseq		fairseq
fairseq_cli		fairseq_cli
scripts		scripts
.gitignore		.gitignore
CODE_OF_CONDUCT.md		CODE_OF_CONDUCT.md
CONTRIBUTING.md		CONTRIBUTING.md
LICENSE		LICENSE
README.md		README.md
eval_lm.py		eval_lm.py
fairseq.gif		fairseq.gif
fairseq_logo.png		fairseq_logo.png
fb_train.py		fb_train.py
generate.py		generate.py
generate.sh		generate.sh
generate_cmlm.py		generate_cmlm.py
get_data.sh		get_data.sh
hubconf.py		hubconf.py
interactive.py		interactive.py
preprocess.py		preprocess.py
run_generate.sh		run_generate.sh
run_train.sh		run_train.sh
score.py		score.py
setup.py		setup.py
train.py		train.py
train.sh		train.sh
train_AR.sh		train_AR.sh
train_classifier.py		train_classifier.py
train_classifier.sh		train_classifier.sh

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

Continuous Mask-Predict

Preprocess

Train

Training Continuous Mask Predict

Training the distilled classifier

AR model training

Evaluation

License

About

Releases

Packages

Languages

License

yair-schiff/Mask-Predict-Continuous

Folders and files

Latest commit

History

Repository files navigation

Continuous Mask-Predict

Preprocess

Train

Training Continuous Mask Predict

Training the distilled classifier

AR model training

Evaluation

License

About

Resources

License

Code of conduct

Stars

Watchers

Forks

Releases

Packages 0

Languages

Packages