bertin-project
/

bertin-roberta-base-spanish

Model card Files Files and versions

Metrics Training metrics Community

versae commited on Jul 6, 2021

Commit

a1f93c9

·

1 Parent(s): d988382

Updating run script

Files changed (1) hide show

run.sh +13 -5

run.sh CHANGED Viewed

@@ -1,22 +1,30 @@
 HUB_TOKEN=`cat $HOME/.huggingface/token`
 ./run_mlm_flax.py \
     --output_dir="./" \
     --model_type="roberta" \
     --config_name="./" \
     --tokenizer_name="./" \
-    --dataset_name="large_spanish_corpus" \
-    --dataset_config_name="combined" \
     --max_seq_length="128" \
     --pad_to_max_length  \
     --per_device_train_batch_size="128" \
     --per_device_eval_batch_size="128" \
-    --learning_rate="3e-4" \
     --save_strategy="steps" \
     --save_steps="10000" \
     --save_total_limit="5" \
-    --warmup_steps="1000" \
     --overwrite_output_dir \
-    --num_train_epochs="8" \
     --dtype="bfloat16" \
     --push_to_hub_model_id="flax-community/bertin-roberta-large-spanish" \
     --push_to_hub_token="$HUB_TOKEN"

+# From https://arxiv.org/pdf/1907.11692.pdf
 HUB_TOKEN=`cat $HOME/.huggingface/token`
 ./run_mlm_flax.py \
     --output_dir="./" \
     --model_type="roberta" \
     --config_name="./" \
     --tokenizer_name="./" \
+    --dataset_name="mc4" \
+    --dataset_config_name="es" \
+    --dataset_streamnig \
     --max_seq_length="128" \
     --pad_to_max_length  \
     --per_device_train_batch_size="128" \
     --per_device_eval_batch_size="128" \
+    --adam_beta1="0.9" \
+    --adam_beta2="0.98" \
+    --adam_epsilon="1e-6" \
+    --learning_rate="4e-4" \
+    --weight_decay="0.01" \
     --save_strategy="steps" \
     --save_steps="10000" \
     --save_total_limit="5" \
+    --warmup_steps="30000" \
     --overwrite_output_dir \
+    --num_train_steps="500000" \
+    --eval_steps="10000" \
+    --logging_steps="500" \
     --dtype="bfloat16" \
     --push_to_hub_model_id="flax-community/bertin-roberta-large-spanish" \
     --push_to_hub_token="$HUB_TOKEN"