proxectonos
/

nos-coda_iacobus-pt-gl

+save_data: /mnt/netapp1/Proxecto_NOS/mt/corpus/iacobus/pt-gl/aut/models
+## Where the vocab(s) will be written
+src_vocab: /mnt/netapp1/Proxecto_NOS/mt/corpus/iacobus/pt-gl/aut/models/run/bpe.vocab.src
+tgt_vocab: /mnt/netapp1/Proxecto_NOS/mt/corpus/iacobus/pt-gl/aut/models/run/bpe.vocab.tgt
+overwrite: True
+# Corpus opts:
+data:
+#    en-es:
+#        path_src: /mnt/netapp1/Proxecto_NOS/mt/corpus/nmt-pld/en-es/train.en10k.txt
+#        path_tgt: /mnt/netapp1/Proxecto_NOS/mt/corpus/nmt-pld/en-es/train.es10k.txt
+        #transforms: [bpe, filtertoolong]
+        #weight: 100
+#    en-pt:
+#        path_src: /mnt/netapp1/Proxecto_NOS/mt/corpus/nmt-pld/en-pt/train.en10k.txt
+#        path_tgt: /mnt/netapp1/Proxecto_NOS/mt/corpus/nmt-pld/en-pt/train.pt10k.txt
+#        weight: 5
+    pt-gl:
+        path_src: /mnt/netapp1/Proxecto_NOS/mt/corpus/iacobus/pt-gl/aut/train.pt35k.txt
+        path_tgt: /mnt/netapp1/Proxecto_NOS/mt/corpus/iacobus/pt-gl/aut/train.gl35k.txt
+        transforms: [bpe, filtertoolong]
+#    en-it:
+#        path_src: /mnt/netapp1/Proxecto_NOS/mt/corpus/nmt-pld/en-it/train.en10k.txt
+#        path_tgt: /mnt/netapp1/Proxecto_NOS/mt/corpus/nmt-pld/en-it/train.it10k.txt
+#    en-ro:
+#        path_src: /mnt/netapp1/Proxecto_NOS/mt/corpus/nmt-pld/en-ro/train.en10k.txt
+#        path_src: /mnt/netapp1/Proxecto_NOS/mt/corpus/nmt-pld/en-ro/train.ro10k.txt
+    valid:
+        path_src: /mnt/netapp1/Proxecto_NOS/mt/corpus/iacobus/pt-gl/aut/valid.pt35k.txt
+        path_tgt: /mnt/netapp1/Proxecto_NOS/mt/corpus/iacobus/pt-gl/aut/valid.gl35k.txt
+        transforms: [bpe, filtertoolong]
+### Transform related opts:
+#### Subword
+src_subword_model: /mnt/netapp1/Proxecto_NOS/mt/corpus/iacobus/pt-gl/aut/pt_35k.code
+tgt_subword_model: /mnt/netapp1/Proxecto_NOS/mt/corpus/iacobus/pt-gl/aut/gl_35k.code
+#src_subword_vocab: /home/compartido/paulo/modelos/run/bpe.vocab.src
+#tgt_subword_vocab: /home/compartido/paulo/modelos/run/bpe.vocab.tgt
+#src_subword_model: ../sentencepiece/en-gl/en.sp.model
+#tgt_subword_model: ../sentencepiece/en-gl/gl.sp.model
+src_subword_type: bpe
+tgt_subord_type: bpe
+src_subword_nbest: 1
+src_subword_alpha: 0.0
+tgt_subword_nbest: 1
+tgt_subword_alpha: 0.0
+#### Filter
+src_seq_length: 150
+tgt_seq_length: 150
+# silently ignore empty lines in the data
+skip_empty_level: silent
+##embeddings
+#src_embeddings: /mnt/lustre/scratch/nlsas//home/usc/ci/pgo/modelos/embeddings/en.emb.txt
+#tgt_embeddings: /mnt/lustre/scratch/nlsas//home/usc/ci/pgo/modelos/embeddings/gl.emb.txt
+src_embeddings: /mnt/netapp1/Proxecto_NOS/mt/treino_data/embeddings/pt.emb.txt
+tgt_embeddings: /mnt/netapp1/Proxecto_NOS/mt/treino_data/embeddings/gl.emb.txt
+## supported types: GloVe, word2vec
+embeddings_type: "word2vec"
+# word_vec_size need to match with the pretrained embeddings dimensions
+#word_vec_size: 300
+# General opts
+save_model: /mnt/netapp1/Proxecto_NOS/mt/corpus/iacobus/pt-gl/aut/models/
+keep_checkpoint: 50
+save_checkpoint_steps: 10000
+average_decay: 0.0005
+seed: 1234
+report_every: 1000
+train_steps: 400000
+valid_steps: 10000
+# Batching
+queue_size: 10000
+bucket_size: 32768
+world_size: 1
+gpu_ranks: [0]
+batch_type: "tokens"
+batch_size: 4096
+valid_batch_size: 64
+batch_size_multiple: 1
+max_generator_batches: 2
+accum_count: [4]
+accum_steps: [0]
+# Optimization
+model_dtype: "fp16"
+optim: "adam"
+learning_rate: 2
+warmup_steps: 8000
+decay_method: "noam"
+adam_beta2: 0.998
+max_grad_norm: 0
+label_smoothing: 0.1
+param_init: 0
+param_init_glorot: true
+normalization: "tokens"
+# Model
+encoder_type: transformer
+decoder_type: transformer
+position_encoding: true
+max_len: 6000
+#max_relative_positions: 20
+enc_layers: 12
+dec_layers: 12
+heads: 16
+#rnn_size: 512
+hidden_size: 512
+word_vec_size: 512
+transformer_ff: 2048
+dropout_steps: [0]
+dropout: [0.1]
+attention_dropout: [0.1]
+share_decoder_embeddings: true
+share_embeddings: false