Set test batch size to 1

elizabethdinella · elizabethdinella · commit a0dcd6737fee · 2020-03-13T16:13:08.000-04:00
diff --git a/config.py b/config.py
@@ -6,7 +6,7 @@ def get_default_config(args):
         config.SAVE_EVERY_EPOCHS = 1
         config.PATIENCE = 10
         config.BATCH_SIZE = 450
-        config.TEST_BATCH_SIZE = 256
+        config.TEST_BATCH_SIZE = 1
         config.READER_NUM_PARALLEL_BATCHES = 1
         config.SHUFFLE_BUFFER_SIZE = 10000
         config.CSV_BUFFER_SIZE = 100 * 1024 * 1024  # 100 MB
diff --git a/preprocess.sh b/preprocess.sh
@@ -21,10 +21,11 @@
 #   recommended to use a multi-core machine for the preprocessing 
 #   step and set this value to the number of cores.
 # PYTHON - python3 interpreter alias.
-TRAIN_DIR=/data2/edinella/java-small-clean-seq-c/training
-VAL_DIR=/data2/edinella/java-small-clean-seq-c/validation
-TEST_DIR=/data2/edinella/java-small-clean-seq-c/test
-DATASET_NAME=java-small-clean-seq-c
+PREFIX=/data2/edinella/seq-lim-b/
+TRAIN_DIR=$PREFIX/training
+VAL_DIR=$PREFIX/validation
+TEST_DIR=$PREFIX/test
+DATASET_NAME=seq-lim-b
 MAX_DATA_CONTEXTS=1000
 MAX_CONTEXTS=200
 SUBTOKEN_VOCAB_SIZE=186277
diff --git a/train.sh b/train.sh
@@ -5,9 +5,10 @@
 # test_data: by default, points to the validation set, since this is the set that
 #   will be evaluated after each training iteration. If you wish to test
 #   on the final (held-out) test set, change 'val' to 'test'.
-type=java-small-clean-seq-c
-dataset_name=java-small-clean-seq-c
-data_dir=data/java-small-clean-seq-c
+
+type=seq-lim-b
+dataset_name=seq-lim-b
+data_dir=data/seq-lim-b
 data=${data_dir}/${dataset_name}
 test_data=${data_dir}/${dataset_name}.val.c2s
 model_dir=models/${type}