Training in progress, step 16000

Browse files

Files changed (12) hide show

.ipynb_checkpoints/added_tokens-checkpoint.json +1 -0
.ipynb_checkpoints/config-checkpoint.json +107 -0
.ipynb_checkpoints/eval-checkpoint.py +1 -1
.ipynb_checkpoints/preprocessor_config-checkpoint.json +9 -0
.ipynb_checkpoints/special_tokens_map-checkpoint.json +1 -0
.ipynb_checkpoints/todo-checkpoint.txt +4 -0
.ipynb_checkpoints/tokenizer_config-checkpoint.json +1 -0
eval.py +1 -1
log_mozilla-foundation_common_voice_7_0_fr_test_predictions.txt +10 -10
mozilla-foundation_common_voice_7_0_fr_test_eval_results.txt +2 -2
pytorch_model.bin +1 -1
todo.txt +4 -0

.ipynb_checkpoints/added_tokens-checkpoint.json ADDED Viewed

	@@ -0,0 +1 @@


1	+ {"<s>": 317, "</s>": 318}

.ipynb_checkpoints/config-checkpoint.json ADDED Viewed

	@@ -0,0 +1,107 @@

+{
+  "_name_or_path": "facebook/wav2vec2-xls-r-300m",
+  "activation_dropout": 0.1,
+  "adapter_kernel_size": 3,
+  "adapter_stride": 2,
+  "add_adapter": false,
+  "apply_spec_augment": true,
+  "architectures": [
+    "Wav2Vec2ForCTC"
+  ],
+  "attention_dropout": 0.0,
+  "bos_token_id": 1,
+  "classifier_proj_size": 256,
+  "codevector_dim": 768,
+  "contrastive_logits_temperature": 0.1,
+  "conv_bias": true,
+  "conv_dim": [
+    512,
+    512,
+    512,
+    512,
+    512,
+    512,
+    512
+  ],
+  "conv_kernel": [
+    10,
+    3,
+    3,
+    3,
+    3,
+    2,
+    2
+  ],
+  "conv_stride": [
+    5,
+    2,
+    2,
+    2,
+    2,
+    2,
+    2
+  ],
+  "ctc_loss_reduction": "mean",
+  "ctc_zero_infinity": false,
+  "diversity_loss_weight": 0.1,
+  "do_stable_layer_norm": true,
+  "eos_token_id": 2,
+  "feat_extract_activation": "gelu",
+  "feat_extract_dropout": 0.0,
+  "feat_extract_norm": "layer",
+  "feat_proj_dropout": 0.0,
+  "feat_quantizer_dropout": 0.0,
+  "final_dropout": 0.0,
+  "hidden_act": "gelu",
+  "hidden_dropout": 0.0,
+  "hidden_size": 1024,
+  "initializer_range": 0.02,
+  "intermediate_size": 4096,
+  "layer_norm_eps": 1e-05,
+  "layerdrop": 0.0,
+  "mask_feature_length": 64,
+  "mask_feature_min_masks": 0,
+  "mask_feature_prob": 0.25,
+  "mask_time_length": 10,
+  "mask_time_min_masks": 2,
+  "mask_time_prob": 0.75,
+  "model_type": "wav2vec2",
+  "num_adapter_layers": 3,
+  "num_attention_heads": 16,
+  "num_codevector_groups": 2,
+  "num_codevectors_per_group": 320,
+  "num_conv_pos_embedding_groups": 16,
+  "num_conv_pos_embeddings": 128,
+  "num_feat_extract_layers": 7,
+  "num_hidden_layers": 24,
+  "num_negatives": 100,
+  "output_hidden_size": 1024,
+  "pad_token_id": 317,
+  "proj_codevector_dim": 768,
+  "tdnn_dilation": [
+    1,
+    2,
+    3,
+    1,
+    1
+  ],
+  "tdnn_dim": [
+    512,
+    512,
+    512,
+    512,
+    1500
+  ],
+  "tdnn_kernel": [
+    5,
+    3,
+    3,
+    1,
+    1
+  ],
+  "torch_dtype": "float32",
+  "transformers_version": "4.17.0.dev0",
+  "use_weighted_layer_sum": false,
+  "vocab_size": 319,
+  "xvector_output_dim": 512
+}

.ipynb_checkpoints/eval-checkpoint.py CHANGED Viewed

@@ -86,7 +86,7 @@ def main(args):
             batch["audio"]["array"], chunk_length_s=args.chunk_length_s, stride_length_s=args.stride_length_s
         )
-        batch["prediction"] = prediction["text"]
         batch["target"] = normalize_text(batch["sentence"])
         return batch

             batch["audio"]["array"], chunk_length_s=args.chunk_length_s, stride_length_s=args.stride_length_s
         )
+        batch["prediction"] = prediction["text"].replace("<s>", "")
         batch["target"] = normalize_text(batch["sentence"])
         return batch

.ipynb_checkpoints/preprocessor_config-checkpoint.json ADDED Viewed

	@@ -0,0 +1,9 @@

+{
+  "do_normalize": true,
+  "feature_extractor_type": "Wav2Vec2FeatureExtractor",
+  "feature_size": 1,
+  "padding_side": "right",
+  "padding_value": 0,
+  "return_attention_mask": true,
+  "sampling_rate": 16000
+}

.ipynb_checkpoints/special_tokens_map-checkpoint.json ADDED Viewed

	@@ -0,0 +1 @@


1	+ {"bos_token": "<s>", "eos_token": "</s>", "unk_token": "[UNK]", "pad_token": "[PAD]", "additional_special_tokens": [{"content": "<s>", "single_word": false, "lstrip": false, "rstrip": false, "normalized": true}, {"content": "</s>", "single_word": false, "lstrip": false, "rstrip": false, "normalized": true}]}

.ipynb_checkpoints/todo-checkpoint.txt ADDED Viewed

	@@ -0,0 +1,4 @@

+TODO:
+- enlever apostrophe des caractères à enlever
+- ajouter une liste de caractères qui ne sont pas de la langue française
+- change epoch pour éviter des entrainements trop long

.ipynb_checkpoints/tokenizer_config-checkpoint.json ADDED Viewed

	@@ -0,0 +1 @@


1	+ {"unk_token": "[UNK]", "bos_token": "<s>", "eos_token": "</s>", "pad_token": "[PAD]", "do_lower_case": false, "word_delimiter_token": "\|", "special_tokens_map_file": null, "tokenizer_file": null, "name_or_path": "./", "tokenizer_class": "Wav2Vec2CTCTokenizer"}

eval.py CHANGED Viewed

@@ -86,7 +86,7 @@ def main(args):
             batch["audio"]["array"], chunk_length_s=args.chunk_length_s, stride_length_s=args.stride_length_s
         )
-        batch["prediction"] = prediction["text"]
         batch["target"] = normalize_text(batch["sentence"])
         return batch

             batch["audio"]["array"], chunk_length_s=args.chunk_length_s, stride_length_s=args.stride_length_s
         )
+        batch["prediction"] = prediction["text"].replace("<s>", "")
         batch["target"] = normalize_text(batch["sentence"])
         return batch

log_mozilla-foundation_common_voice_7_0_fr_test_predictions.txt CHANGED Viewed

@@ -1,20 +1,20 @@
 0
-<s>un <s>v<s>rai<s> tra<s>vai<s>l in<s>té<s>re<s>s<s>s<s>an<s>t<s> <s>v<s>a<s> <s>en<s>f<s>int ê<s>tr<s>e <s>me<s>n<s>e<s> sur ce<s> <s>s<s>u<s>j<s>e<s>t<s>
 1
-<s>u<s>n<s>e<s> <s>ré<s>for<s>me pr<s>o<s>f<s>onde est né<s>ce<s>s<s>sai<s>r<s>e<s>t<s>a<s>r<s>e<s>
 2
-<s>pa<s>s<s> <s>s<s>i<s> n<s>om<s>breuses qu<s>e<s> ç<s>a<s>
 3
-<s>u<s>n<s> <s>c<s>o<s>m<s>i<s>t<s>é<s> <s>i<s>n<s>t<s>e<s>r<s>mi<s>n<s>i<s>s<s>t<s>é<s>r<s>i<s>a<s>l<s> <s>d<s>u<s> <s>h<s>a<s>n<s>di<s>c<s>o<s>p<s> <s>s<s>es<s>t<s> <s>t<s>é<s>n<s>u<s> <s>i<s> <s>y<s> <s>a<s> qu<s>e<s>l<s>qu<s>e<s>s<s> <s>s<s>m<s>ai<s>n<s>e<s>s<s>
 4
-<s>l<s>a<s> <s>p<s>a<s>r<s>o<s>l<s>e<s> <s>est<s> <s>à<s> <s>m<s>on<s>s<s>i<s>eu<s>r<s> <s>l<s>a<s>l<s>i<s>n<s> <s>r<s>a<s>m<s>an<s>d<s>i<s>è<s>r<s> <s>p<s>ou<s>r<s> <s>s<s>ou<s>t<s>e<s>n<s>i<s>r<s> <s>l<s>a<s>m<s>e<s>n<s>d<s>e<s>m<s>en<s>t<s> <s>n<s>u<s>m<s>é<s>r<s>o<s> <s>c<s>in<s>t<s> <s>v<s>ing<s>t<s>hui<s>t<s>
 5
-<s>c<s>es<s>t<s> <s>en<s>t<s>ou<s>t<s>c<s>a<s>j<s>u<s>p<s>i<s>t<s>e<s>r<s>i<s>a<s>
 6
-<s>a<s> <s>v<s>oi<s>s<s>
 7
-<s>j<s>ai<s> d<s>onc<s> le<s>x<s>p<s>é<s>ri<s>en<s>ce des a<s>n<s>nées p<s>a<s>s<s>s<s>é<s> j<s>en<s> <s>d<s>i<s>r<s>ai<s> un mo<s>t<s> t<s>ou<s>t<s> à<s> <s>lh<s>eu<s>r<s>
 8
-<s>d<s>ou<s>z<s>e<s> <s>m<s>i<s>n<s>u<s>t<s>es<s> <s>t<s>r<s>en<s>t<s>e<s>
 9
-<s>c<s>est u<s>ne <s>é<s>vi<s>d<s>en<s>c<s>e<s>

 0
+un vrai travail intéressant va enfin être menéer sur ce sujet
 1
+une réforme profonde est nécessairetre
 2
+passi nombreuses que ça
 3
+un commité interministérial du handicap sest tenu il yy a quelques semaines
 4
+la parole est à monsieurlalanramandière pour soutenir lamendement numéro cint vingthuit
 5
+cesten tout cas jupiterien
 6
+o voix
 7
+jai donc lexpérience des années passés jen dirais un mot tout à lheur
 8
+douze minutes trente
 9
+cest une évidence

mozilla-foundation_common_voice_7_0_fr_test_eval_results.txt CHANGED Viewed

	@@ -1,2 +1,2 @@
1	- WER: 0.~~9444444444444444~~
2	- CER: 2.~~1333333333333333~~


1	+ WER: 0.25
2	+ CER: 0.05714285714285714

pytorch_model.bin CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:4c3ac64bd4f5320d0e0631b4cd16a1e393eec92d067186ff9fce4e09c6a862e8
 size 1263231601

 version https://git-lfs.github.com/spec/v1
+oid sha256:225a50bb21443d9a7d1334e463a7ba97349b1b0eaa025b85174c20035155fdbd
 size 1263231601

todo.txt ADDED Viewed

	@@ -0,0 +1,4 @@

+TODO:
+- enlever apostrophe des caractères à enlever
+- ajouter une liste de caractères qui ne sont pas de la langue française
+- change epoch pour éviter des entrainements trop long