FremyCompany
commited on
Commit
·
1a10833
1
Parent(s):
06a7a87
Upload model information
Browse files- .gitattributes +3 -0
- README.md +83 -0
- added_tokens.json +1 -0
- alphabet.json +1 -0
- config.json +107 -0
- eval.py +205 -0
- eval.sh +2 -0
- install_requirements.sh +11 -0
- log_mozilla-foundation_common_voice_8_0_nl_test_predictions.txt +0 -0
- log_mozilla-foundation_common_voice_8_0_nl_test_targets.txt +0 -0
- log_speech-recognition-community-v2_dev_data_nl_validation_predictions.txt +16 -0
- log_speech-recognition-community-v2_dev_data_nl_validation_targets.txt +16 -0
- mozilla-foundation_common_voice_8_0_nl_test_eval_results.txt +2 -0
- preprocessor_config.json +10 -0
- run-step1.sh +28 -0
- run-step2.sh +33 -0
- run-step3.sh +31 -0
- run_speech_recognition_ctc.py +742 -0
- run_speech_recognition_ctc_for_cgn.py +766 -0
- special_tokens_map.json +1 -0
- speech-recognition-community-v2_dev_data_nl_validation_eval_results.txt +2 -0
- tokenizer_config.json +1 -0
- vocab.json +1 -0
.gitattributes
CHANGED
@@ -25,3 +25,6 @@ saved_model/**/* filter=lfs diff=lfs merge=lfs -text
|
|
25 |
*.zip filter=lfs diff=lfs merge=lfs -text
|
26 |
*.zstandard filter=lfs diff=lfs merge=lfs -text
|
27 |
*tfevents* filter=lfs diff=lfs merge=lfs -text
|
|
|
|
|
|
|
|
25 |
*.zip filter=lfs diff=lfs merge=lfs -text
|
26 |
*.zstandard filter=lfs diff=lfs merge=lfs -text
|
27 |
*tfevents* filter=lfs diff=lfs merge=lfs -text
|
28 |
+
language_model/unigrams.txt filter=lfs diff=lfs merge=lfs -text
|
29 |
+
*.dic filter=lfs diff=lfs merge=lfs -text
|
30 |
+
*.aff filter=lfs diff=lfs merge=lfs -text
|
README.md
ADDED
@@ -0,0 +1,83 @@
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
1 |
+
---
|
2 |
+
language:
|
3 |
+
- nl
|
4 |
+
tags:
|
5 |
+
- automatic-speech-recognition
|
6 |
+
- mozilla-foundation/common_voice_8_0
|
7 |
+
- robust-speech-event
|
8 |
+
- model_for_talk
|
9 |
+
- nl
|
10 |
+
- nl_NL
|
11 |
+
- nl_BE
|
12 |
+
datasets:
|
13 |
+
- mozilla-foundation/common_voice_8_0
|
14 |
+
model-index:
|
15 |
+
- name: xls-r-nl-v1-cv8-lm
|
16 |
+
results:
|
17 |
+
- task:
|
18 |
+
name: Automatic Speech Recognition
|
19 |
+
type: automatic-speech-recognition
|
20 |
+
dataset:
|
21 |
+
name: Common Voice 8
|
22 |
+
type: mozilla-foundation/common_voice_8_0
|
23 |
+
args: nl
|
24 |
+
metrics:
|
25 |
+
- name: Test WER
|
26 |
+
type: wer
|
27 |
+
value: 3.93
|
28 |
+
- name: Test CER
|
29 |
+
type: cer
|
30 |
+
value: 1.22
|
31 |
+
- task:
|
32 |
+
name: Automatic Speech Recognition
|
33 |
+
type: automatic-speech-recognition
|
34 |
+
dataset:
|
35 |
+
name: Robust Speech Event - Dev Data
|
36 |
+
type: speech-recognition-community-v2/dev_data
|
37 |
+
args: nl
|
38 |
+
metrics:
|
39 |
+
- name: Test WER
|
40 |
+
type: wer
|
41 |
+
value: 16.35
|
42 |
+
- name: Test CER
|
43 |
+
type: cer
|
44 |
+
value: 9.64
|
45 |
+
---
|
46 |
+
|
47 |
+
# XLS-R-based CTC model with 5-gram language model from Open Subtitles
|
48 |
+
|
49 |
+
This model is a version of [facebook/wav2vec2-xls-r-2b-22-to-16](https://huggingface.co/facebook/wav2vec2-xls-r-2b-22-to-16) fine-tuned mainly on the [CGN dataset](https://taalmaterialen.ivdnt.org/download/tstc-corpus-gesproken-nederlands/), as well as the [MOZILLA-FOUNDATION/COMMON_VOICE_8_0 - NL](https://commonvoice.mozilla.org) dataset (see details below), on which a large 5-gram language model is added based on the Open Subtitles Dutch corpus. This model achieves the following results on the evaluation set (of Common Voice 8.0):
|
50 |
+
- Wer: 0.03931
|
51 |
+
- Cer: 0.01224
|
52 |
+
|
53 |
+
> **IMPORTANT NOTE**: The `hunspell` typo fixer is **not enabled** on the website, which returns raw CTC+LM results. Hunspell reranking is only available in the `eval.py` decoding script. For best results, please use the code in that file while using the model locally for inference.
|
54 |
+
|
55 |
+
> **IMPORTANT NOTE**: Evaluating this model requires `apt install libhunspell-dev` and a pip install of `hunspell` in addition to pip installs of `pipy-kenlm` and `pyctcdecode` (see `install_requirements.sh`); in addition, the chunking lengths and strides were optimized for the model as `12s` and `2s` respectively (see `eval.sh`).
|
56 |
+
|
57 |
+
## Model description
|
58 |
+
|
59 |
+
The model takes 16kHz sound input, and uses a Wav2Vec2ForCTC decoder with 48 letters to output the letter-transcription probabilities per frame.
|
60 |
+
|
61 |
+
To improve accuracy, a beam-search decoder based on `pyctcdecode` is then used; it reranks the most promising alignments based on a 5-gram language model trained on the Open Subtitles Dutch corpus.
|
62 |
+
|
63 |
+
To further deal with typos, `hunspell` is used to propose alternative spellings for words not in the unigrams of the language model. These alternatives are then reranked based on the language model trained above, and a penalty proportional to the levenshtein edit distance between the alternative and the recognized word. This for examples enables to correct `collegas` into `collega's` or `gogol` into `google`.
|
64 |
+
|
65 |
+
## Intended uses & limitations
|
66 |
+
|
67 |
+
This model can be used to transcribe Dutch or Flemish spoken dutch to text (without punctuation).
|
68 |
+
|
69 |
+
## Training and evaluation data
|
70 |
+
|
71 |
+
The model was:
|
72 |
+
|
73 |
+
0. initialized with [the 2B parameter model from Facebook](facebook/wav2vec2-xls-r-2b-22-to-16).
|
74 |
+
1. trained `5` epochs (6000 iterations of batch size 32) on [the `cv8/nl` dataset](https://huggingface.co/datasets/mozilla-foundation/common_voice_8_0).
|
75 |
+
2. trained `1` epoch (36000 iterations of batch size 32) on [the `cgn` dataset](https://taalmaterialen.ivdnt.org/download/tstc-corpus-gesproken-nederlands/).
|
76 |
+
3. trained `5` epochs (6000 iterations of batch size 32) on [the `cv8/nl` dataset](https://huggingface.co/datasets/mozilla-foundation/common_voice_8_0).
|
77 |
+
|
78 |
+
### Framework versions
|
79 |
+
|
80 |
+
- Transformers 4.16.0
|
81 |
+
- Pytorch 1.10.2+cu102
|
82 |
+
- Datasets 1.18.3
|
83 |
+
- Tokenizers 0.11.0
|
added_tokens.json
ADDED
@@ -0,0 +1 @@
|
|
|
|
|
1 |
+
{"<s>": 46, "</s>": 47}
|
alphabet.json
ADDED
@@ -0,0 +1 @@
|
|
|
|
|
1 |
+
{"labels": [" ", "a", "b", "c", "d", "e", "f", "g", "h", "i", "j", "k", "l", "m", "n", "o", "p", "q", "r", "s", "t", "u", "v", "w", "x", "y", "z", "\u00e0", "\u00e2", "\u00e4", "\u00e6", "\u00e7", "\u00e8", "\u00e9", "\u00ea", "\u00eb", "\u00ee", "\u00ef", "\u00f3", "\u00f4", "\u00f6", "\u00f9", "\u00fb", "\u00fc", "\u2047", "", "<s>", "</s>"], "is_bpe": false}
|
config.json
ADDED
@@ -0,0 +1,107 @@
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
1 |
+
{
|
2 |
+
"_name_or_path": "./output.step2/",
|
3 |
+
"activation_dropout": 0.0,
|
4 |
+
"adapter_kernel_size": 3,
|
5 |
+
"adapter_stride": 2,
|
6 |
+
"add_adapter": false,
|
7 |
+
"apply_spec_augment": true,
|
8 |
+
"architectures": [
|
9 |
+
"Wav2Vec2ForCTC"
|
10 |
+
],
|
11 |
+
"attention_dropout": 0.0,
|
12 |
+
"bos_token_id": 1,
|
13 |
+
"classifier_proj_size": 256,
|
14 |
+
"codevector_dim": 1024,
|
15 |
+
"contrastive_logits_temperature": 0.1,
|
16 |
+
"conv_bias": true,
|
17 |
+
"conv_dim": [
|
18 |
+
512,
|
19 |
+
512,
|
20 |
+
512,
|
21 |
+
512,
|
22 |
+
512,
|
23 |
+
512,
|
24 |
+
512
|
25 |
+
],
|
26 |
+
"conv_kernel": [
|
27 |
+
10,
|
28 |
+
3,
|
29 |
+
3,
|
30 |
+
3,
|
31 |
+
3,
|
32 |
+
2,
|
33 |
+
2
|
34 |
+
],
|
35 |
+
"conv_stride": [
|
36 |
+
5,
|
37 |
+
2,
|
38 |
+
2,
|
39 |
+
2,
|
40 |
+
2,
|
41 |
+
2,
|
42 |
+
2
|
43 |
+
],
|
44 |
+
"ctc_loss_reduction": "mean",
|
45 |
+
"ctc_zero_infinity": false,
|
46 |
+
"diversity_loss_weight": 0.1,
|
47 |
+
"do_stable_layer_norm": true,
|
48 |
+
"eos_token_id": 2,
|
49 |
+
"feat_extract_activation": "gelu",
|
50 |
+
"feat_extract_dropout": 0.0,
|
51 |
+
"feat_extract_norm": "layer",
|
52 |
+
"feat_proj_dropout": 0.0,
|
53 |
+
"feat_quantizer_dropout": 0.0,
|
54 |
+
"final_dropout": 0.0,
|
55 |
+
"hidden_act": "gelu",
|
56 |
+
"hidden_dropout": 0.0,
|
57 |
+
"hidden_size": 1920,
|
58 |
+
"initializer_range": 0.02,
|
59 |
+
"intermediate_size": 7680,
|
60 |
+
"layer_norm_eps": 1e-05,
|
61 |
+
"layerdrop": 0.0,
|
62 |
+
"mask_feature_length": 10,
|
63 |
+
"mask_feature_min_masks": 0,
|
64 |
+
"mask_feature_prob": 0.0,
|
65 |
+
"mask_time_length": 10,
|
66 |
+
"mask_time_min_masks": 2,
|
67 |
+
"mask_time_prob": 0.05,
|
68 |
+
"model_type": "wav2vec2",
|
69 |
+
"num_adapter_layers": 3,
|
70 |
+
"num_attention_heads": 16,
|
71 |
+
"num_codevector_groups": 2,
|
72 |
+
"num_codevectors_per_group": 320,
|
73 |
+
"num_conv_pos_embedding_groups": 16,
|
74 |
+
"num_conv_pos_embeddings": 128,
|
75 |
+
"num_feat_extract_layers": 7,
|
76 |
+
"num_hidden_layers": 48,
|
77 |
+
"num_negatives": 100,
|
78 |
+
"output_hidden_size": 1920,
|
79 |
+
"pad_token_id": 45,
|
80 |
+
"proj_codevector_dim": 1024,
|
81 |
+
"tdnn_dilation": [
|
82 |
+
1,
|
83 |
+
2,
|
84 |
+
3,
|
85 |
+
1,
|
86 |
+
1
|
87 |
+
],
|
88 |
+
"tdnn_dim": [
|
89 |
+
512,
|
90 |
+
512,
|
91 |
+
512,
|
92 |
+
512,
|
93 |
+
1500
|
94 |
+
],
|
95 |
+
"tdnn_kernel": [
|
96 |
+
5,
|
97 |
+
3,
|
98 |
+
3,
|
99 |
+
1,
|
100 |
+
1
|
101 |
+
],
|
102 |
+
"torch_dtype": "float32",
|
103 |
+
"transformers_version": "4.16.0",
|
104 |
+
"use_weighted_layer_sum": false,
|
105 |
+
"vocab_size": 48,
|
106 |
+
"xvector_output_dim": 512
|
107 |
+
}
|
eval.py
ADDED
@@ -0,0 +1,205 @@
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
1 |
+
#!/usr/bin/env python3
|
2 |
+
#############################################################
|
3 |
+
# eval.sh contains the commands to run evaluation properly
|
4 |
+
############################################################
|
5 |
+
import argparse
|
6 |
+
import sys
|
7 |
+
import re
|
8 |
+
from typing import Dict
|
9 |
+
|
10 |
+
import torch
|
11 |
+
from datasets import Audio, Dataset, load_dataset, load_metric
|
12 |
+
|
13 |
+
from pyctcdecode import BeamSearchDecoderCTC
|
14 |
+
from transformers import AutoFeatureExtractor, AutoTokenizer, pipeline
|
15 |
+
import transformers
|
16 |
+
|
17 |
+
import Levenshtein
|
18 |
+
import hunspell
|
19 |
+
dutch_unigrams = set(open('language_model/unigrams.txt').read().splitlines())
|
20 |
+
dutch_hobj = hunspell.HunSpell('dictionaries/nl.dic', 'dictionaries/nl.aff')
|
21 |
+
MOST_COMMON_WORDS = 'ik|je|het|de|is|dat|een|niet|en|wat|van|we|in|ze|op|te|hij|zijn|er|maar|me|die|heb|voor|met|als|ben|was|n|mijn|u|dit|aan|hier|om|naar|dan|jij|weet|ja|kan|geen|zo|nog|wil|wel|moet|goed|hem|hebben|nee|heeft|waar|nu|hoe|ga|t|kom|uit|gaan|bent|haar|doen|ook|mij|over|of|daar|zou|al|jullie|bij|ons|zal|gaat|hebt|meer|waarom|iets|laat|deze|had|doe|wie|jou|moeten|alles|denk|kunnen|eens|echt|man|weg|door|oké|toch|zien|alleen|s|nou'.split('|')
|
22 |
+
|
23 |
+
def log_results(result: Dataset, args: Dict[str, str]):
|
24 |
+
"""DO NOT CHANGE. This function computes and logs the result metrics."""
|
25 |
+
|
26 |
+
log_outputs = args.log_outputs
|
27 |
+
dataset_id = "_".join(args.dataset.split("/") + [args.config, args.split])
|
28 |
+
|
29 |
+
# load metric
|
30 |
+
wer = load_metric("wer")
|
31 |
+
cer = load_metric("cer")
|
32 |
+
|
33 |
+
# compute metrics
|
34 |
+
wer_result = wer.compute(references=result["target"], predictions=result["prediction"])
|
35 |
+
cer_result = cer.compute(references=result["target"], predictions=result["prediction"])
|
36 |
+
|
37 |
+
# print & log results
|
38 |
+
result_str = f"WER: {wer_result}\n" f"CER: {cer_result}"
|
39 |
+
print(result_str)
|
40 |
+
|
41 |
+
with open(f"{dataset_id}_eval_results.txt", "w") as f:
|
42 |
+
f.write(result_str)
|
43 |
+
|
44 |
+
# log all results in text file. Possibly interesting for analysis
|
45 |
+
if log_outputs is not None:
|
46 |
+
pred_file = f"log_{dataset_id}_predictions.txt"
|
47 |
+
target_file = f"log_{dataset_id}_targets.txt"
|
48 |
+
|
49 |
+
with open(pred_file, "w") as p, open(target_file, "w") as t:
|
50 |
+
|
51 |
+
# mapping function to write output
|
52 |
+
def write_to_file(batch, i):
|
53 |
+
p.write(f"{i}" + "\n")
|
54 |
+
p.write(batch["prediction"] + "\n")
|
55 |
+
t.write(f"{i}" + "\n")
|
56 |
+
t.write(batch["target"] + "\n")
|
57 |
+
|
58 |
+
result.map(write_to_file, with_indices=True)
|
59 |
+
|
60 |
+
|
61 |
+
def normalize_text(text: str) -> str:
|
62 |
+
"""DO ADAPT FOR YOUR USE CASE. this function normalizes the target text."""
|
63 |
+
|
64 |
+
chars_to_ignore_regex = '[,?.!\-\;\:"“%‘”�—’…–]' # noqa: W605 IMPORTANT: this should correspond to the chars that were ignored during training
|
65 |
+
|
66 |
+
text = re.sub(chars_to_ignore_regex, "", text.lower())
|
67 |
+
text = re.sub(r'[\n\s]+', ' ', text)
|
68 |
+
|
69 |
+
return text
|
70 |
+
|
71 |
+
|
72 |
+
def main(args):
|
73 |
+
# load dataset
|
74 |
+
dataset = load_dataset(args.dataset, args.config, split=args.split, use_auth_token=True)
|
75 |
+
|
76 |
+
# for testing: only process the first two examples as a test
|
77 |
+
# dataset = dataset.select(range(10))
|
78 |
+
|
79 |
+
# load processor
|
80 |
+
feature_extractor = AutoFeatureExtractor.from_pretrained(args.model_id)
|
81 |
+
sampling_rate = feature_extractor.sampling_rate
|
82 |
+
|
83 |
+
# resample audio
|
84 |
+
dataset = dataset.cast_column("audio", Audio(sampling_rate=sampling_rate))
|
85 |
+
|
86 |
+
# load eval pipeline
|
87 |
+
if args.device is None:
|
88 |
+
args.device = 0 if torch.cuda.is_available() else -1
|
89 |
+
|
90 |
+
config = transformers.PretrainedConfig.from_pretrained(args.model_id)
|
91 |
+
model=transformers.Wav2Vec2ForCTC.from_pretrained(args.model_id)
|
92 |
+
tokenizer = AutoTokenizer.from_pretrained(args.model_id)
|
93 |
+
processor = transformers.AutoProcessor.from_pretrained(args.model_id)
|
94 |
+
language_model = BeamSearchDecoderCTC.model_container[processor.decoder._model_key]._kenlm_model
|
95 |
+
#asr = pipeline("automatic-speech-recognition", model=args.model_id, device=args.device)
|
96 |
+
asr = pipeline("automatic-speech-recognition", config=config, model=model, tokenizer=tokenizer, feature_extractor=feature_extractor, decoder=processor.decoder, device=args.device)
|
97 |
+
|
98 |
+
# map function to decode audio
|
99 |
+
def map_to_pred(batch):
|
100 |
+
prediction = asr(
|
101 |
+
batch["audio"]["array"], chunk_length_s=args.chunk_length_s, stride_length_s=args.stride_length_s
|
102 |
+
)
|
103 |
+
|
104 |
+
text = prediction["text"]
|
105 |
+
|
106 |
+
#print('### STARTING TO FIND TYPOS')
|
107 |
+
|
108 |
+
text_words = text.split(' ')
|
109 |
+
is_known_word = lambda word: (len(word) == 0) or (word in dutch_unigrams) or (dutch_hobj.spell(word))
|
110 |
+
for index in range(len(text_words)):
|
111 |
+
|
112 |
+
curr_word = text_words[index]
|
113 |
+
if is_known_word(curr_word): continue
|
114 |
+
|
115 |
+
prev_word = text_words[index-1] if index>0 else '<s>'
|
116 |
+
next_word = text_words[index+1] if index<len(text_words)-1 else '</s>'
|
117 |
+
|
118 |
+
BASE_PENALITY = -2
|
119 |
+
EDIT_PENALITY = -0.5
|
120 |
+
|
121 |
+
curr_word_letters = curr_word.replace("-",'').replace("'",'')
|
122 |
+
|
123 |
+
best_word = curr_word
|
124 |
+
best_score = language_model.score(prev_word + ' ' + curr_word + ' ' + next_word) + BASE_PENALITY
|
125 |
+
#print(prev_word + ' ' + curr_word + ' ' + next_word + ' == ' + str(best_score))
|
126 |
+
|
127 |
+
# typos suggestions by hunspell
|
128 |
+
all_suggestions = list(dutch_hobj.suggest(curr_word))
|
129 |
+
|
130 |
+
# diphtongs flattened: a common faillure mode of pyctcdecode for dutch
|
131 |
+
if curr_word.endswith('lik'):
|
132 |
+
all_suggestions.append(curr_word[0:-3] + 'lijk')
|
133 |
+
|
134 |
+
# words merged: a common failure mode of pyctcdecode for dutch
|
135 |
+
for most_common_word in MOST_COMMON_WORDS:
|
136 |
+
if curr_word.endswith(most_common_word):
|
137 |
+
all_suggestions.append(curr_word[0:-len(most_common_word)] + ' ' + most_common_word)
|
138 |
+
|
139 |
+
# look at all the suggestions and see if somethings look better
|
140 |
+
for sugg_word in all_suggestions:
|
141 |
+
sugg_word = sugg_word.lower()
|
142 |
+
#if sugg_word == curr_word or sugg_word == best_word: continue
|
143 |
+
sugg_word_letters = sugg_word.replace("-",'').replace("'",'')
|
144 |
+
sugg_distance = Levenshtein.distance(curr_word_letters, sugg_word_letters)
|
145 |
+
sugg_distance = sugg_distance if sugg_distance > 0 else -3 # bonus for perfect match
|
146 |
+
sugg_score = language_model.score(prev_word + ' ' + sugg_word + ' ' + next_word) + EDIT_PENALITY * sugg_distance
|
147 |
+
#print(prev_word + ' ' + sugg_word + ' ' + next_word + ' == ' + str(sugg_score))
|
148 |
+
if sugg_score > best_score:
|
149 |
+
best_score = sugg_score
|
150 |
+
best_word = sugg_word
|
151 |
+
|
152 |
+
if best_word != curr_word:
|
153 |
+
text_words[index] = best_word
|
154 |
+
#print(curr_word + ' ===> ' + best_word)
|
155 |
+
|
156 |
+
#print('### DONE FINDING TYPOS')
|
157 |
+
|
158 |
+
text = " ".join(text_words)
|
159 |
+
|
160 |
+
batch["prediction"] = text
|
161 |
+
batch["target"] = normalize_text(batch["sentence"])
|
162 |
+
return batch
|
163 |
+
|
164 |
+
# run inference on all examples
|
165 |
+
result = dataset.map(map_to_pred, remove_columns=dataset.column_names)
|
166 |
+
|
167 |
+
# compute and log_results
|
168 |
+
# do not change function below
|
169 |
+
log_results(result, args)
|
170 |
+
|
171 |
+
|
172 |
+
if __name__ == "__main__":
|
173 |
+
parser = argparse.ArgumentParser()
|
174 |
+
|
175 |
+
parser.add_argument(
|
176 |
+
"--model_id", type=str, required=True, help="Model identifier. Should be loadable with 🤗 Transformers"
|
177 |
+
)
|
178 |
+
parser.add_argument(
|
179 |
+
"--dataset",
|
180 |
+
type=str,
|
181 |
+
required=True,
|
182 |
+
help="Dataset name to evaluate the `model_id`. Should be loadable with 🤗 Datasets",
|
183 |
+
)
|
184 |
+
parser.add_argument(
|
185 |
+
"--config", type=str, required=True, help="Config of the dataset. *E.g.* `'en'` for Common Voice"
|
186 |
+
)
|
187 |
+
parser.add_argument("--split", type=str, required=True, help="Split of the dataset. *E.g.* `'test'`")
|
188 |
+
parser.add_argument(
|
189 |
+
"--chunk_length_s", type=float, default=None, help="Chunk length in seconds. Defaults to 5 seconds."
|
190 |
+
)
|
191 |
+
parser.add_argument(
|
192 |
+
"--stride_length_s", type=float, default=None, help="Stride of the audio chunks. Defaults to 1 second."
|
193 |
+
)
|
194 |
+
parser.add_argument(
|
195 |
+
"--log_outputs", action="store_true", help="If defined, write outputs to log file for analysis."
|
196 |
+
)
|
197 |
+
parser.add_argument(
|
198 |
+
"--device",
|
199 |
+
type=int,
|
200 |
+
default=None,
|
201 |
+
help="The device to run the pipeline on. -1 for CPU (default), 0 for the first GPU and so on.",
|
202 |
+
)
|
203 |
+
args = parser.parse_args()
|
204 |
+
|
205 |
+
main(args)
|
eval.sh
ADDED
@@ -0,0 +1,2 @@
|
|
|
|
|
|
|
1 |
+
python ./eval.py --model_id ./ --dataset mozilla-foundation/common_voice_8_0 --config nl --split test --log_outputs
|
2 |
+
python ./eval.py --model_id ./ --dataset speech-recognition-community-v2/dev_data --config nl --split validation --chunk_length_s 12.0 --stride_length_s 2.0 --log_outputs
|
install_requirements.sh
ADDED
@@ -0,0 +1,11 @@
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
1 |
+
# base libraries
|
2 |
+
pip install transformers datasets
|
3 |
+
# speech recognition libraries
|
4 |
+
pip install torch torchaudio librosa jiwer
|
5 |
+
# language model decoding libraries
|
6 |
+
pip install pyctcdecode
|
7 |
+
pip install https://github.com/kpu/kenlm/archive/master.zip
|
8 |
+
# spellchecking library
|
9 |
+
sudo apt-get install -y libhunspell-dev
|
10 |
+
pip install hunspell
|
11 |
+
pip install python-Levenshtein
|
log_mozilla-foundation_common_voice_8_0_nl_test_predictions.txt
ADDED
The diff for this file is too large to render.
See raw diff
|
|
log_mozilla-foundation_common_voice_8_0_nl_test_targets.txt
ADDED
The diff for this file is too large to render.
See raw diff
|
|
log_speech-recognition-community-v2_dev_data_nl_validation_predictions.txt
ADDED
@@ -0,0 +1,16 @@
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
1 |
+
0
|
2 |
+
lieve mensen wie houdt van muziek klassieke muziek moet haast wel in amstelveen popmuziek of zijn er ook jonge hiphoppers in de zaal dacht ik al iedereen heeft wel iets met muziek maar is muziek ook heilzaamwant stel je nou toch eens voor je bent dri jaar en je hebt een goed icu en je begrijpt alles maar je kan geen oogcontact maken en ik kan ook niet terugpraten of hoe zou het nou zijn jij bent vandaag de mens of verstandelijk beperkt en je weet niet wie de persoon is die binnenkomt hoe laat het is of war je bent of hoe zou je je voelen als jij morgen een hersenbloeding krijgt en je moet gaan revalideren en je kan alles weer tuinieren koken autorijden je begrijpt juist wel wat iedeeen zegt maar je bent niet in staat om één stom woord te spreken wat brengt muziek je dan hoe heilzaam zou muziek kunnen zijn daar wil ik het met jullie nu over hebben aan het eind van mijn betoog hoop ik dat je zelf toepassingen ziet voor mensen met een beperking om hun kwaliteit van leven te veranderen maar eerst iets over het ontstaan van muziek heel lang geleden dan heb ik het over vijftigduizend jaar geleden konden we al trommelen op fluitjes blazen maar we konden geen woord spreken en sinds die tijd heeft muziek een belangrijk onderdeel gespeeld in onze culturen in onze rituelen en nu heden ten dagen in onze westerse maatschappij waar is het muziek in onze rituelen ja we hebben muziekles op school we luisteren naar muziek is incidenteel maar geen ritueel oké op onze huwelijksdag hebben we de vogeltjes dans dat is ons ritueel of bij onze begrafenissen de top drie androchelli erreclapton en lieve mensen wereldwijd de nummer één is varia nog steeds niet miketelkamp want dat is niet werldwijd is dat dan alles zijn wij niet meer muzikaal wie n u vindt zich muzikaal wie van jullie speelt een instrument niet zoveel maar toch blijkt dat zesennegentig procent van jullie muzikaal is en dat is al aangetoond bij babys wetenschappelijk van twee dagen oud laat wens meen testen dit is zacht en dit is hard klap me mee allemaal zijn we muzikaal we scoren meer dan zesennegentig procent lieve mensen al heel lang luisteren wij naar muzici ik noem dit muziek beleving muziektherapie gaat een stapje verder daarmee bedoel ik dat een professional via een interventie met muziek kwetsbare mensen met een beperking of een trauma hun kwaliteit van leven probeert te verhogen en er is steeds meer wetenschappelijk onderzoek daarvoor en steeds meer bewijs ook al is het nog flinterdun en ik heb de eer om met de nederlandse wetenschappelijke top erik schede dikzwaaphenkjan honing om aan breed publiek de wonderen van muziek te tonen en het allerbelangrijkste resultaat nu van het wetenschappelijk onderzoek is dat in tegenstelling tot onze spraak gehoor gevoel emotie dat zit allemaal op één bepaalde plek in onze hersenen terwijl muziek dat zit in heel veel gebieden van onze hersenen en ik kom daar dadelijk nog op terug met een voorbeeld maar hoe is nu het effect op ons eigen leven onze kwaliteit van leven en laat ik mezelf maar als voorbeeld nemen als kind zijnde schreef ik verschrikkelijk slecht dramas altijd werden mijn ouders op school geroepen als wieren onvoldoende had en ze waren het zo zat dat ze mij hebben laten testen een hersenfilmpje en uit die test kwam naar voren dat ik een aangeboren trilling in mijn rechterhand had was dat effe makkelijk ik hoefde nooit meer mijn best te doen en als therapie kreeg ik pianoles en daardoor heb ik niet alleen een rik sociaal leven gekregen ik heb in heel veel beentjes gespeeld ik heb zelfs mevrouw dardoor ontmoet maar wat ook naar voren kwam in die test is dat ik een ongelooflijk concentratieprobleem heb en dat heb ik weten om te buigen in een kracht ik durf van me van mezelf namelijk te stellen dat ik erg creatief ben goed kan verbinden maar ik ben zo waardeloos in die details en prikkels ik ik word hier echt helemaal gek van is maar goed donker is want het het gaat alles maar malen ennio een beroepsmuzikant zal ik dus niet worden altijd maar oefenen de hele dag door een heel ander voorbeeld mijn oudste zoon hier ook in de zaal op de middelbare school was die wel zo ontzettend slecht in wiskunde maar goddank was er een oplettende wiskundeleraar en die wist dat die piano speelde en zei jo die wiskundetoets die daaraan komt dat wordt helemaal niks voor ou in plaats van die toets ga jij maar een stuk muziek componeren want het is namelijk ook logisch nadenken en ik laat jullie nu een fragment horen wat ie doen als opstandige puber pfff heeft gecombineerd maakt die alle muziek voor mijn filmen hij heeft ook zijn werkvan gemaakt hij speelt acht instrumenten en muziek is zijn leven en zijn werk we gaan nu een stapje verder hoe is het nu voor mensen met een beperking door mijn jongste zoon ben ik gaan filmen ik ga jullie nu wat filmfragmenten laten zien hij zou het veel beter doen om aan te kunnen tonen wat muziek kan doen als je een beperking hebt maar eerst even wat cijfers twintig procent van ons is mantelzorger eenzelfde percentage heeft te maken met direct of indirect met dementie een vorm daarvan of parkingson en het dubbele lieve mensen psychisch lijden in welke vorm dan ook veertig procent van ons en ach slechts drie procent ptss traumas hier op op deze foto zien jullie syrische kinderen die gevlucht zijn en nu hier wonen en eenzaamheidsouderen in onze vergrijzende maatschappij maar ook jongeren en als laatste voorbeeld blijkt weinig slechts één procent van jullie of mijzelf heeft een vorm van autism maar in nederland hebben we t dan wel over honderdzeventigduizend mensen wie van jullie heeft met deze groep mensen te maken zou muziek deze mensen kunnen helpen we gaan er wat voorbeelden kijken die ik heb gefilmd we zien als eerste demo een autistisch jongetje uit amstelveen van drie jaar oud sheena jullie zien het in het begin geen oogcontact geen spraak naarmate die muziektherapie vordert komt dat op gang een heel ander voorbeeld jaqueline een zwaar verstandelijk beperkte vrouwzat doen we straks ik ga met jou meespelen op de trommel ik zet jouw stoel weer even recht want als je goed bij de piano komt eerstwat jullie hier zien is dat jacqueline contact maakt door haar hoofd op de instrumenten te leggen ze wil die trillingen voelen en je zal hier denken ach dertig minuten muziektherapie wat een flauwe kul maar bij mensen jacqueline met enorme onrust en ook mensen met demensie het effect hiervan rust kan wel twee dagen aanhouden dertig minuten wie wilde nog een voorbeeld ja nee ik wel anders had ik het toch gedaan mevrouw jonkers na een hersenbloeding orang wat zegt u dit is het klassieke voorbeeld van iemand met een vasie je kan niet spreken na een hersenbloeding deze mevrouw kan alles weer er zijn voorbeelden bekend dat mensen zes maanden lang niet kunnen spreken en na de eerste muziektherapiesessie en dat is wat ik in het begin zei want ik kom nog met een voorbeeld die muziek grijpt in op meerdere delen van de hersenen en daardoor kan het na het spraakcentrum gaan en zo kan deze mevrouw zingend leren spreken dat is toch ongelooflijk wat kunnen jullie nou zelf thuis doen ik geef u twee voorbeelden we kennen allemaal de parkinsonpatiënt die kan als een dronken man dan moet ik die stip over als een dronken man lopen maar hoe simpel is het als je daar vingerknippend naast gaat lopen zal je zien dat de parkinsonpatiënt in dat ritme mee kan lopen hoe bevrijdend moet dat voor hem zijneen tweede heel ander voorbeeld dat ik al eerder noemde mensen met een vorm van demensie met veel onrust en vooral tijdens een wasbeurt is natuurlijk een drama maar hoe makkelijk is het om samen een liedje te zingen van vroegere onrust gaat weg er is plezier en de wasbeurt is nog sneller klaar en dan zitten wij met totlullen in de zorg over heen tijd tegen geld ik bedoel is dit effectief of niet eerder klaar vijftig procent van ons blijkt baat te hebben met de inzet van muziek ik heb genoemd de voorbeelden dimensie twintig procent we zijn mantelzorgers twintig procent psychisch lijden veertig procent dus ik zou jullie willen uitnodigen om thuis aa de gang te gaan en inderdaad niet lullen maar doen lang levende muziek
|
3 |
+
1
|
4 |
+
goedemiddag mijn naam is dus adkasberge dat was mij een hele mooie microfoon beloofd zodat ik dansend over het podium kon maar goed ik heb nu deze eventjes vast ik ga jullie meenemen in het verhaaltje van mijn school klein schooltje vijftig leerlingen speciaal onderwijs en daar zijn kinderen die ja je kan ze psychiatrische patiëntjes noemen je kan ze zeer moeilijk opvoedbarnoemen het zijn in ieder geval kinderen met een rafelrandje en de kinderen met dat rafelrandje die zijn bekeken door de inspectie en wij zijn ook bekeken door de inspectie en gelukkig zijn wij een zeer zwakke school dat i gelukkig zal ik uitleggen waarom wij dat zo noemen want het is wij vinden het werk wat we doen heel ingewikkeld en het zou zo raar zijn als iemand één dag bij je langskomt die komt kijken die komt in je papieren kijken en die kijkt eventjes links naar de kinderen en die zegt dan nou dat doe je allemaal prima uitstekend goed bedacht terwijl we het zelf zo vreselijk moeilijk al vinden dat werk wat we aan het doen zijn je zou eigenlijk veel langer moeten kijken om een goed oordeel te kunnen vellen een voorbeeld om jullie een beetje mee te nemen in een dagje vanochtend had ik twee klassen ik had één zieke collega twee klassen bij mekaar daar zijn er nog maar twintig leerlingen hoor dus het is altijd nog minder wat in de basisschool in één klas zit ze zijn lief aan het lezen ik heb de winter rolden ze luister goed naar me meestal één heeft zn boek niet open en ik vraag aan hem joh wat je leesboek het antwoord is in je hol at en dan denk ik dan moet je even meenemen je staat voor twintig leerlingen en dan zegt er één en de rest hoort dat ziet dat waar is je leesboek in je hol had en als je dat dan proeft ik vond het vreselijk leuk ik vind t heel grappig want het klinkt als hij het zegt klinkt het nog veel beter dan als ik het zeg maar wat moet je dan en dat is een probleem wat je dan moet oplossen met dat kind want je wil dat ie gaat lezen en wat bedoelt ie eigenlijk want hij staat net als de titel van mijn stukje hij staat bol van spanning en hij bedoelt eigenlijk help me want straks moet ik misschien nog gaan voorlezen ook en horen anderen de fouten die ik maak dus help me maar hij kan dat niet zo goed onder woord brengen dus hij zegt in je hol dus mijn antwoord moet daar zijn ik moet niet boos worden ik moet leuk zijn tegen hem en ik kan alleen maar tegen hem zeggen van ja dat is de donker daar brandt geen licht en als je dat dan gezegd hebt dan weet hij hij vindt het niet erg dat ik dat gezegd heb de rest van de klas die heeft lol al gehad maar het is natuurlijk in een soort gevleugelde term wel de hele dag door de school gegaan dat als ik dus wat vroeger heb je brouwt nou filmer in in je hol had ja dat is leuk tenminste ja ik vind dat leuk mijn collegas vinden dat leuk en die kinderen vinden dat charmant een inspecteur die komt kijken die die vindt er eigenlijk helemaal niks aan die vindt dat niet leuk die waardeert dat ook niet wij daarna des te meer dus daarom zeggen we gelukkig een zeer zwakke school dat moet niet blijven want dat kan consequenties hebben want als het een zeer zwakke school blijft dan wordt op een gegeven moment de deur gesloten en dan vangen wij niet meer die kinderen op en wat voor kinderen zijn dat nou wat ik net beschreef met een rafelrandje en die kunnen eigenlijk niet meer op een andere school terecht want wat doen wij kinderen zitten thuis ze komen bij ons voor vier maanden vijf maanden soms een jaar soms twee jaar wij doen er maar wat mee zoals ik net al beschreef het kan een beetje leuk zijn het kan een beetje grappig zijn maar ze willen wel naar school komen ze blijven naar school komen na die tijd bij ons die drie vier maanden halfjaar heel jaar twee jaar gaan ze weer naar school zitten ze dus niet meer thuis ik zal een voorbeeld geven niet hetzelfde kereltje wat i net noemde maar was een jongen die had een schoolfobie althans het werd ons verteld als een schoolfobie hij ging een jaar niet naar school de school war die eigenlijk op ingeschreven zat ja die ving nog steeds het geld want die jongen is ingeschreven hij kon niet hij is wel ingeschreven bij ons nou dat werd te gek leerplicht zegt van die jonge moet naar school nou die basisschool wilde nu meer hebben waar moet ie dan naartoe dan kom je bij ons terecht op een gegeven moment want wij zijn een beetje het laatste schooltje wat wat kan of wat wat wil deze jongen kwam met zijn ouders langs dat was al heel wat en kwam dus vertellen hij was twaalf jaar dus had een jaar thuisgezeten hd en wat achterstand opgelopen natuurlijk en zou de volgende dag bij mij in de klas komen ik heb tegen hem gezegd als je niet komt ik heb m uitgelegd hoe wij een beetje werken ik heb het heel gezellig gemaakt aantrekkelijk gemaakt voor als je niet komt kom ik je halen de volgende dag ngen uur wij beginnen kwart over negen gaan we echt wel met de les beginnen tien voor half tien nou laten we nou met die les gaan beginnen hij was er natuurlijk niet toen dacht ik van wat moet ik doen kan blijven wachten tot ie wel komt of tot zijn ouders hem brengen gebeld moeder aan de telefoon hij wil niet nou toen moest ik een belofte waarmaken ik moest hem gaan halen was niet zo ver van de school vandaan ergens in parkwiek en ik kwam bij het ades en toen dacht ik waar ben ik in hemels nou mee bezig ga ik iemand ophalen van huis om les te gaan geven die niet wil maar ik had het beloofd dus ik denk we moeten toch blijven doen geen naambordje gordijn was dicht bij de keuken dus ik denk klop aan of er een hele kennel met bouviers was en toen dacht ik kan nu nog steeds weggaan toen ging de deur open en kleinmoedje daar open aardige mevrouw kom maar binnen ik zeg ik kom m ophalen heb beloofd ze zegt ja hij is boven maar voordat ik ook maar naar een trap kon kijken had ik al een innige omarm omarming met die bofjij voorpoten hier grote kop daar net doen of je niet bang bent niet naar die bofjij kijken interesseert je niks je doet iets met psychiatrie dus je kijkt hem niet in de ogen en je doet of het normaal is dus ik zeg ik ga nu de trap op als u die hond in de gaten houdt nou dat wilde moeder wel doen ik ging de trap op kwam ik eerst broer tegen stond in een boxershort broers ongeveer jaar of achttien negentien dikke gade ketting om onze kleren te strijken dus ik denk in wat voor wereld ben ik terechtgekomen omarming met een boefje een strijkend jongen in een boxershort en ik zoek naar een kind wat niet naar school wil kwam bij zdrie deur open en ja dat lag prinsheerlijk tweepersoons bed jongen van twaalf jaar flatscreen t is drie jaar geleden dus ik praat niet over nu want nu heeft iedereen dat flatscreen behoorlijk formaat alle spelcomputers die je maar kan bedenken raampje open was lekker weer en hij lag daar ja waarom zou je nog naar school gaan dan doe je da niet en dan komt er iemand binnen en die gaat zeggen we hebben een afspraak het enige wat ik kon zeggen van nou kan die boef jij misschien in die andere kamer dag ik naar beneden en ik verwacht dat je binnen vijf minuten aangekleed bent want we gaan naar school en tot mijn verbazing is dat gelukt aangekleed en naar school hij vond het wel gezellig maar daar komt het eerste moment is het weekend twee dgen vrij ga je dan nog ja na het eerste weekend ging ik nog naar school kwam ik bij de herfstvakantie een week thuis hij werd een keer ziek komt die daarna nog naar school ja hij is het hele jaar naar school geweest hij heeft dus inderdaad groep acht op die manier bij ons gedaan op een zeer leuke manier en ging daarna naar het voortzet onderwijs een keer heb ik nog uit bed gehaald samen met iemand van die school daarna niet meer heb ik het niet meer gedaan want ik vond dat moet ik een ander laten doen drie jaar later ja dat klopt wat ik net verteld heb drie jaar later kwam ik hem tegen op omroepland want ik erkende hem hoewel ze zn gezicht een beetje onzichtbaar hadden gemaakt ik zag dat het hem was wat had ie nou gedaan hij had de pries de toyota pries van een of andere buurman had die genomen en was ie tegen de bui gerij dus die had toen rondgereden joyriding plezier zal die zeker gehad hebben en hij eindigde in de voortuin vlak daarna kwam ie toch bij mij langs op school en ik vroeg aan hem het was zeker een automaat ja want anders had ie er niet in kunnen rijden ik zeg in mijn auto staat daar en daar blijf je vanaf hij is daarvan afgebleven en ging maar ging helaas nie meer naar school en dat is nou het verhaal wat ik een beetje vertel deze kinderen die hebben dus iets meer nodig dan het rekenen taal en het lezen dat hebben ze ook allemaal nodig maar ze hebben iets meer nodig ze moeten toch denken van ik ben welkom op een bepaalde plek en welkom maken op een bepaalde plek dat is denk ik het allermoeilijkste is dat een kuchje van zeven minuten nee acht en een half en dat wel kon voelen dat is belangrijk maar dat valt zo moeilijk uit te leggen aan inspectie en misschien is het al heel moeilijk om aan jullie uit te leggen maar ik kom nu wel bij mijn eind van eigenlijk van het verhaal en dat is wij hebben vreselijk ons best gedaan de afgelopen periode om te denken van hoe moeten wij de inspectie dit verhaal nou laten zien nou dat kan ik ik kan misschien het dvdtje opzetten daarna en dan kan ik zeggen van kijk hier maar dat trapt ze niet in want ze wil de resultaten zien die wij van tevoren hebben opgeschreven dat kind gaat naar de havo gaat thel doen die gaat babyleid gaat kbl doen daar gaat het niet om inspectie daar gaat het echt niet om ht gaat dat in ieder geval weer naar school gaat en naar school blijft gaan en dat moet lukken das een beetje onze opdrachten mijn opdracht ook naar de inspectie om dat elder te maken het leuke is want dat komt nu donderdag achttien april staat zij weer voor de deur de inspectie en het zou zo grappig zijn en zo leuk zijn als mensen die hier nu zitten denken goh dat verhaal dat snap ik en dat moet zo blijven die school de school heeft de bongerd we zitten op boomgaard weg nummer tien a vergeet die a niet en misschien kan je een briefje in de bus doen joh je moet je langer zo doen of nee die inspectie die heeft pas gelijk dank jullie wel
|
5 |
+
2
|
6 |
+
als ik je vraag om naar mij te luisteren en jij begint mij adviezen te geven dan doe je niet wat ik vraag als ik je vraag om naar mij te luisteren en jij begint mij te vertellen dat ik niet mg voelen wat ik voel dan neem je mijn gevoelens niet serieus als ik je vraag om naar mij te luisteren en jij denkt dat je iets moet doen om mijn problemen op te lossen dan laat je mij in de steek hoe vreemd dat ook mag lijken dus alsjeblieft luister naar mij en probeer me te begrijpen en als je ook wil praten wacht dan even tot ik klaar ben en dan beloof ik dat ik op mijn beurt ook naar jou zou luisteren deze tekst zou zo door mij als kind gezegd kunnen zijn ik voelde mij als kind niet gehoord en niet begrepen ik ben net als die zeventigduizend andere kinderen die jaarlijks te maken krijgen met de scheiding van hun ouders een kind van gescheiden ouders en ik heb last gehad van die scheiding ik ben ook een van die kinderen die sinds de scheiding het contact is verloren met een ouder ik weet nog dat ik dacht wie is er voor mij wie kan met mij meedenken wie kan mij helpen ik voelde me z alleen ik was zo boos maar eigenlijk was ik vooral eigenlijk heel verdrietig ik was pas twaalf en ik had geen idee wat ik met de situatie tussen mijn ouders aan moest mijn droom is dat we een wereld creëren waar geen kind zich zo hoef te voelen een wereld waar ieder kind zich gehoord en begrjpen voelt het liefst zo vroeg mogelijk zodat we snel kunnen achterhalen wat er bij een kind leeft en het kind steun kunnen bieden mijn eigen ouders gingen uit elkaar toen ik een jaar of vier vijf was zijn ze officieel gescheiden ze zijn later weer bij elkaar gekomen voor de kinderen niet zon heel goed plan achteraf want de spanning was thuis uiteindelijk weer opnieuw voelbaar mijn ouders leefden langs elkaar heen er werd gezwegen aan tafel en mijn moeder sliep wel eens bij mij op de kamer vreemd om als kind mee t maken je voelt dan alles dat er iets niet klopt en wat deed ik ik dacht ik ga zorgen dat het thuis allemaal goed gaat ik gedroeg mjn verbeelding deed mijn schoolwerk hielp met opruimen thuis als maar niemand last van mij hadtoen mijn ouders mij en mijn broer uiteindelijk vertelden toen ik elf jaar oud was dat zij opnieuw uit elkaar gingen kwam dat eigenlijk niet als een verrassing want ik had de spanning gevoeld ik was enorm verdrietig maar naast dat verdriet voelde ik ook ergens opluchting ik dacht zou het dan eindelijk klaar zijn met die spanning in huis zou het dan eindelijk weer rustig worden niets bleek helaas minder waard te zijn het werd alleen maar onrustiger er bleken onder andere rechtszaken tussen mijn ouders te lopen en daar kwam ik op mijn twaalfde achter omdat ik een brief van de rechter kreeg omdat ik ook iets mocht vinden van die scheiding ik weet nu als zesendertigjarige vrouw dat mijn verhaal anders had kunnen lopen als er direct toen mijn ouders uit elkaar gingen iemand voor mij was geweest iemand die naast mij had gestaan naar mij had geluisterd maar ook iemand die mij uitleg had gegeven over wat er allemaal bij scheiding komt kijken en die verstand had van hoe kinderen kunnen denken en die mijn stem en mijn gedachten en gevoelens in perspectief had kunnn plaatsen en had kunnen vertalen naar mijn ouders dan hoefde ik dat niet te doenom nog even terug te komen op mijn verhaal ik vertelde al dat ik een brief van de rechter kreeg en om jullie een stukje juridisch mee te geven ik ben immers jurist kinderen van twaalf jaar of ouder die krijgen een brief van de rechter waarin gevraagd wordt om iets te vinden van die scheiding over het gezag de hoofdverblijfplaats en de omgangsregeling contactregeling moeilijke onderwerpen voor kinderen om daar je mening over te geven een kind mag komen hoeft niks te doen maar mag ook een brief schrijven vaak hun eerste post voor mij was dit mijn eerste post van een rechter nog wel en ik durfde over deze situatie niet eens echt met mijn vriendinnen te praten over wat ik echt dacht en voelde en dan moest ik naar de rechter dat durfde ik niet langsgaan durfde ik absoluut niet maar ik had wel het idee dat die rechter iets van mij verwachten in de zin van dat ik het moest oplossen tussen mijn ouders dus ik ben een boekwerk aan emoties gaan opschrijven en een brief gaan schrijven aan de rechter niemand hielp mij met die brief niemand vertelde mij wat vertelde mij wat mijn gedachten en gevoelens betekenen kijk het naar de situatie tussen mijn ouders maar ook kijken naar mijn leeftijd ik was pas twaalf en niemand vertelde mij wat voor impact mijn brief kon hebben in het juridisch speelvelden jarenlang heb ik gedacht dat mijn brief de oorzaak was van alles want mijn vader werd uiteindelijk uit uit de ouderlijke macht ontheven en hij verdween uit eigen beweging steeds meer uit beeld was dat mijn schuld was dat er wat ik had opgeschreven ik had toch opgeschreven dat ik allebei mijn ouders heel graag wilde zien en dat ik bij hun allebei wilde wonen reageerde hij daarom niet meer op mijn belletjes of op mijn brieven waarom wilde hij mij niet meer zien wat had ik gedaasgedachten en gevoelens die mij als kind van twaalf overspoelden en doorsijpelden in alles wat ik deed ik kreeg moeite met relaties aangaan want ja iemand aan wie je verbindt kan ook weer weggaan ik ging mijn focussen op school ik ging minder eten en ik voelde mij ontzettend onzeker mijn verhaal is geen uniek verhaal het is een verhaal van heel veel kinderen van gescheiden ouders niet de volledige blauwdruk daarvan want elk verhaal is uniek maar wel delen daarvan en nu als professional werkend met kinderen in een scheidingssituatie vertellen kinderen mij zo vaak hoe schuldig zij zich voelen en dat ze bang zijn om tegen hun ouders te zeggen wat ze denken en voelen of dat ze zich verantwoordelijk voelen en denken dat ze het moeten oplossen tussen hun ouders wat mij betreft luisteren wij nog veel te weinig echt naar inderen en daar bedoel ik mee dat wij kinderen of helemaal geen stem geven we slaan ze over of dat wij kinderen hu stem maar beperkt betrekken of dat we ze veel te verantwoordelijk maken dus als een kind zegt we gaan dit doen dan gaan we dat doen maar kinderen zijn niet degenen die de beslissing nemenluisteren naar kinderen staat voor mij dat we hun stem betrekken maar dat we ook goed kijken wat in het belang van kinderen is en dat kan soms tegenstrijdig zijn en dat ze daar uitleg over krijgen terugblikkend op mijn eigen verhaal en eigenlijk vooral kijkend naar de kinderen die te maken hebben met die schuldgevoelens en het loyaliteitsgevoel ben ik aan nadenken of het niet anders kan kunnen wij niet op een kindvriendelijke manier de stem van kinderen betrekken en daarom ben ik in tweeduizend vijftien onderzoek gaan doen naar het buitenland en naar nederland en heb ik de rol van de kindbehartiger ontwikkeld en om jullie mee te geven dat het ook anders kan wil ik jullie het verhaal van marnix delen marnix is een jongetje van negen jaar en zijn ouders die gaan uit elkaar zij zijn getrouwd geweest dus dan moeten zij langs een advocaat een van de advocaten was bekend met de rol van de kindbehartiger en vroeg e andere advocaat zou jij ervoor openstaan dat wij onze cliënten informeren over de kindbehartiger en toestemming vragen aan deze ouders dat zij max ook of marnix ook een belangenbehartiger bieden en beide ouders zijn akkoord gegaan zo waren de advocaten daarvoor de ouders en was de kindhartigerder voor marnix er is bewust gekozen om meerdere gesprekken met marnix te voeren zodat hij goed zijn stem kon uiten goed met hem kon worden meegedacht maar hem ook echt uitleg kon worden gegeven en hij zich vertrouwd kon voelen bij de kindbehartiger want je moet je hele levensverhaal op tafel gooien daar is tijd voor nodig en samen is uiteindelijk een verslag gemaakt waarin en de stem van marnix terugkwam maar waar ook de kinderhartiger vanuit de expertise van de kinderharten advies is neergelegd en dat verslag is naar de rechtbank gegaan de rechter nam dat verslag heel serieus want de ouders hadden allebei hun eigen visie en daar kwam de stem van marnix en het advies van een professionelen uiteindelijk is de visie van marnix daarin gevolgd en is het advies opgevolgd en samen is uiteindelijk na de zitting met de ouders van marni op tafel gegaan en is gekeken hoe een gesprek met marnie kon plaatsvinden om een uitleg te geven over wat er in de zitting had plaatsgevonden en zodat hij nog zijn vragen kon stellen aan zijn ouders en zijn ouders hem konden uitleggen dat die nooit tussen hen hoefde te kiezen en dat ze afspraken hadden gemaakt en rekening wilde houden met hoe hij zich voelde en met zijn mening en ik weet nog dat marlisteins dat gesprek dat vrolijke kopie van at negenjarige jongetje zo trots want hij had zijn stem geuit hij hoefde zich niet schuldig te voelen hij hoefde niet te kiezen tussen zijn ouders en hij zei ik was zo zenuwachtig mijn hart maakt allemaal sprongetjes maar weetje eigenlijk is die scheiding zo erg nog niet jullie zijn eigenlijk veel aardiger tegen elkaar en ik mag ook nog ns een keer twee keer op vakantie zitten ook nog wat voordelen aan en dat kopie van marning dacht ik ja het kan anders en als we naar kinderen luisteren kunnen we ook nog lering trekken uit hun verhaal want wat kinderen aangeven is luister naar mij leg mij dingen uit maar maak mij niet verantwoordelijk ook na de scheiding heb ik allebei mijn ouders nodig ik kan niet tussen mijn ouders kiezen ook al lijkt dat ik dat soms wel doe en biedt mij steun door iemand die er speciaal voor mij is dit horende lieve ouders stel dat jullie te maken hebben met een scheidingssituatie sta open dat jullie kind een stem bieden lieve familieleden en omstandersbied een luisterend oor maar blijf daarbij neutraal kies geen partij voor hun ouderlievenschool sta op voor die kinderen die die steun in die klas nodig hebben waar je ziet wat dat nodig is en vooral lieve kinderen weet dat er mensen zijn die echt naar jullie willen luisteren en dat jullie stem ertoe doet dank u wennen
|
7 |
+
3
|
8 |
+
goeienavond kan de stad de wereld redden met een knipoog aan antwerpen drieënnegentigdie er tot nu over gediscussieerd heeft of of kunst de wereld kan redden ik open een nieuwe debat maar op het einde van deze twintig minuten kent u het juiste antwoord de context de stad wordt in elk geval de wereld mijn werk situeert zich in een grondige overtuiging dat we in een transitiefase zitten in de wereld die vergelijkbaar is met de neolitische revolutie of de industriële revolutie met ndere woorden een transitie waar we ingestapt zijn en waar we eigenlijk niet goed weten waar we uitkomen maar waarbij we toch ongeveer zeker zijn dat we een totaal andere soort samenleving een totaal andere soort menselijke verbanden op het einde zullen krijgen in het begin van de negentiende eeuw woonde tien procent van de wereldbevolking in steden in het begin van de eenentwintigste eeuw is dat al meer dan de helft van de wereldbevolking en in de meest ontwikkelde in de meest ontwikkelde continenten is dat meer dan driekwart tot vier vijfde van de bevolking ie in steden woont en meer en meer zijn dat ook grote steden in negentienhonderd vijftig waren alleen new york en londen steden van meer dan acht miljoen inwoners vandaag groeien de megapolen vooral in de derde wereld aan een geweldige aan een geweldige snelheid vandaag hebben we vierhonderd en elf steden van een miljoen inwoners de grootstad groepeert die urbanisering de stad s ook sinds sinds een paar jaar en vijftien jaar ongeveer het nieuwe centrum van de economie in de periode zestig zeventig die decennia was de gemiddelde rijkdomproductie in de steden over het algemeen lager dan het nationaal gemiddelde de industriële samenleving speelde zich af buiten de steden de postindustriële samenleving die ontwikkelt zich in de steden en vandaag de economie hangt af van de stedelijke sterkte we zien in europa zeker in het in de kerngebied van europa de groei van de steden maar tegelijkertijd ook in perifere gebieden een nieuw fenomeen van shrinking citys steden die tot twintig vijfentwintig procent van hun bevolking verliezen antwerpen is een van die steden die aan het groeien is dat is niet altijd zo geweest een stad is een levend organisme en in de hoogdagen vijftien vijfentachtig voo de val van antwerpen honderdduizend inwoners in het begin van de negentiende eeuw vijfenvijftigduizend inwoners en dat is dan weer pas langzaam omhoog gegaan tot eigenlijk in het begin van de twintigste eeuw driehonderdduizend en de stedelijke ontwikkeling is vooral een fenomeen geweest van de twintigste eeuwse industrialisering in deze stad en we zien opnieuw een ding na de tweede wereldtoer vooral het einde daarvan zestig zeventig de suburbanisatie die pas sinds vijfennegentig eigenlijk sinds deze eeuw omgekeerd is waarbij je opnieuw een stedelijke groei een stedelijke groei krijgt en waarbij je dus een verstedelijking krijgt van de voorstad en een lichte terugkeer van de stadsvlucht ik zeg ligt de terugkeer omdat eigenlijk de groei van de steden vandaag vooral samenhangt met een een verhoogde nataliteit vooral in de populaties van migrantenoorsprong en ten tweede buitenlandse immigratie en we zien dus de steden opnieuw groeien in een stadsgewestelijk gebied ik zie ik laat hier een kaart zien van de verschillende stadsgewesten in in belgië wel nu in deze context moeten ons de vraag stellen welk soort samenleving en welk soort ontwikkeling we dan tegemoet gaanweinig mensen beschouwen zich stedeling dertig procent woont buiten de stedelijke gebieden veertig procent woont in de pendelzones gaan we in de stad werken of winkelen of brengen hun kinderen daar naar de school maar wonen zelf in het buitengebied twintig procent woont aan de rand van de stad tien procent woont in de stad zelf mag ik hier even de vraag stellen de hand op te steken van wie woont in de stad laat ze antwerpton stedelijkheid als ik dat vraag aan mijn studenten in het eerste jaar dan tien vijftien procent van de studenten die hun vinger opsteken in de stad en de rest beschouwt zichzelf buiten de stad en dan laat ik zoiets zien dan vraag ik aan de mensen waar dat buitenstedelijk gebied eigenlijk is waar ze dan wonen want dit is de verstedelijking dit is de bebouwde zone die je eigenlijk in het noorden van belgië kan zien wel nu dat vertegenwoordigt eigenlijk een super bane mentaliteit ik laat u een citaat zien de stad is de grote bewerker geweest van de geestelijke en ruimtelijke ontworteling er bestaat geen stad van de mens de stad zal altijd de vijand van het menselijke zijn in negentien vierentachtig geschreven door een vlaams politicus wonend in de schaduw van brussel en twee dagen geleden met de vergaderde wereldprobleem dit is reclame rond het autosalon ik vergroot het kleine stukje uit u rijdt in alle comfort en uiterst veilig op weg naar brussel of de jungle van een andere grootstad met andere woorden wij leven in een discours waar wij bedenken dat het goede leven zich afspeelt buiten de stad met een ideaal beeld eigenlijk van een eigen huisje eigen tuintje in het in het voorgebied en waarbij we dus eigenlijk een probleem stellen over het samenleven in de stad met andere woorden we zijn nog altijd overtuigd zoals in de negentiende eeuw zoals de sociologie van de negentiende eeuw en het begin van de twintigste eeuw ons eigenlijk geleerd heeft dat we eerst aan gemeenschapsvorming doen en dat wil zeggen dat we samen met mensen van ongeveer dezelfde taal dezelfde cultuur dezelfde eigenschappen samenwonen en dat we op basis daarvan van gemeenschappelijkheid een maatschappijbouw met andere woorden de socialisatie de menselijke samenleving wordt gedacht en ik denk in deze stad zoals in vele plaatsen in vlaanderen wordt dan nog steeds gedacht dat is aan het socialiseren in de eerste plaats gebeurd in de nationale in de nationale gemeenschapnochtans enk ik niet dat dat een stedelijke vorm van samenleving mogelijk maakt een stad is per definitie een verscheiden mensengemeenschap met verschillende gemainchaften verschillende gemeenschappen en ik zal daarop terugkomen omdat ik denk dat at een van de grote problemen is in de nationale gemeenschap denken we dat we samenleven op basis van een gedeeld verleden ik denk dat er vanavond al over gesproken is wel nu dat gedeeld verleden waarvan we wetendat het voor een belangrijk deel ook een geconstrueerd verhaal is dat bouwt de identiteit de identiteit die in de tijd moet voortgezet worden en gerepresenteerd dat is ook de basis eigenlijk van de vertegenwoordigende democratie de representatieve democratie die het meningsverschil binnen die gelijkheid binnen de identiteit toelaat en uitdrukt maar tegelijkertijd ook de continuïteit moet garanderen en dat gebeurt binnen een territorium waarvan men denkt dat binnen de grenzen de homogeniteit de identiteit groot relatief groot is en dat het verschil met buiten de grenzen altijd groter dan het verschil binnen de grenzen wel nu op al deze belangrijke punten verschilt de stad en de stedelijkheid eigenlijk als we in de stad waar ik nu wil brussel moeten zorgen voor een gedeeld verleden als we eert onze roots moeten vergelijken in een stad waar zesenvijftig procent van de mensen van buiten de stad komt en dat is in antwerpen ook steeds meer het geval welnu dan is dat een project dat op voorhand tot mislukken gedoemd is een stad steunt op lotsverbondenheid of we het nu willen of niet we zullen die stedelijkheid samen in de toekomst vorm moeten geven en dat betekent dat we een project moeten uitwerken dat we naar de toekomst gericht moeten werken en dat project dat heeft niet zo een sterke identiteit die doorheen de tijd langzaamaan is opgebouwd en tot een vast verhaal is vergroeid dat is een hybride verhaal een meng verhaal een verhaal zoals we vanavond hebben gezien al een paar keer op het podium hebben gezien dat geconstrueerd is op basis van het verschil en op basis van tegenstelling en dat betekent dus ook dat je dat niet kan opbouwen zonder aan de mensen te vragen deel te nemen een stad is bij uitstek productief het is daarom dat de participatieve democratie een stedelijk probleem is een stedelijk agendapunt is veel meer dan een nationaal een landelijk agendapunt waar vertegenwoordigen de democratie nog altijd pretendeert het volk te kunnen vertegenwoordigen en die stedelijkheid die speelt zich ook veel meer af in netwerken dan in territoria de ruimtelijkheid de organisatie van de stad en van het verband tussen mensen in die stad is van een andere van een andere soort en dus we moeten dat verschil tussen landelijkheid nationaliteit en tussen stedelijkheid tussen de stedelijke samenleving duidelijk voor ogen voor ogen nemen welnu de stedelijke lijkt mij de mentaliteit te zijn ziehetaliteit van de mondialisering die we met een geleerd woord globalisering noemen omdat de mondialisering plaats grijpt vanuit bepaalde plaatsen gebeurt glokaal gebeurt de stad is dus de plaats een knooppunt voor politieke en sociale reconstructie en wanneer we dus dat een groot probleem is in deze wereld oeten zoeken naar registers naar niveaus waarop dat we de de wereld die een beetje uit onze handen glipt opnieuw onder controle kunnen nemen dan is dat ongetwijfeld aan de ene kant de grote schaal zeg maar de continentale de europese om niet te zeggen d wereldschaal maar aan de andere kant ook zeker de lokale schaal en dan spreek ik over metropolitane gebieden dan spreek ik over stedelijke gebieden en wij moeten dus denken hoe we democratische modellen op dat niveau uitbouwen en een tweede belangrijke conclusie is dat stedelijke cultuur een gemaakte cultuur is geen gegeven cultuur en dus dat wij die cultuur voortdurend in een hernieuwde creativiteit vanuit het verschil vanuit de diversiteit moeten vorm geven en in die zin is inderdaad urban culture van een andere soort dan de cultuur die we gewoonlijk produceren dus de creatieve stad en de stedelijke democratie zijn belangrijke agendapunten voor de wereld van de toekomst wij staan voor een belangrijke demografische uitdaging de bevolking groeit tegen twintig twintig antwerpen plus honderdduizend inwoners en we weten van hoe die die die bevolkingsgroei zal uitzien het maakt de stedelijke bevolking jonger diverser en ook armer dat betekent dus een grote uitdaging voor de stedelijke voor de stedelijke organisatie dat betekent dus dat we nieuwe stedelijke economieën moeten ontwikkelen en dat we er niet moeten van uitgaan dat de bestaande economie die vooral voor hoogopgeleiden dient die die vooral in de dienstensector en de zorgsector zich ontwikkelt dat die zal volstaan om al die nieuwkomers om al die mensen die van buiten komen o te nemen en wij kunnen niet van al die mensen vragen dat ze eerst worden dat ze zich aanpassen aan de bestaande arbeidsmarkt met andere woorden er moet gezocht worden inderdaad naar vanuit de talenten van de mensen vanuit de vaardigheden van de mensen om economische activiteit te ontwikkelen drie belangrijke de vier belangrijke dees waarin die stedelijke ontwikkeling moet gedacht worden duurzame ontwikkeling betekent densiteit verdichting dat is vlaanderen een zeer moeilijke zaak vlaanderen is laat geïndustrialiseerd en hij heeft een een woonpolitiek gevoerd een verspreide woonpolitiek waarbij de mensen meestal niet gaan wonen waar ze werken liefst blijven wonen waar hun grootmoeder geboren is en dan elke morgen van van hun woonplaats naar de werkplaats in de auto zitten meestal stilstaan en vandaag is dat een belangrijk probleem in de in de ontwikkeling de ruimtelijke spreiding is niet duurzaam de mobiliteit is geblokkeerd en we zullen dus naar verdichting moeten gaan een verdichting betekent ook leren omgaan met diversiteit niet alleen vanuit de rand naar de stad kijken als een gebruiksvoorwerp om te komen werken te komen winkelen of aan cultuur te komen doen maar als een samenlevingsmodel op basis van verschil en niet op basis van gelijkheid en dat betekent dus effectief dat we de democratische ontwikkeling zullen moeten moeten herdenken daarin het burgerschap zullen moeten herdenken dat alles moet eigenlijk het onderwerp maken van een toekomstvisie voor de stad van een stadsproject en deel uitmaken van het maatschappelijk debat ik heb op de radio een paar dagen geleden ook gezegd dat ik denk dat zeker in de stadsgewesten van vlaanderen het goed zou zijn mochten de lokale verkiezingen van oktober inderdaad gaan over een stadsproject een stadsproject dat ofwel gedacht wordt op basis van diversiteit en op basis van samenhang creëren op basis van het verschil en dus een kosmopolitische visie van de stad ontwikkeld ofwel een visie op de stad waarbij het eigenlijk suburbane residentiële bewoners zijn die opleggen aan de stad hoe ze zich moet organiseren als een goed gebruiksvoorwerp ik denk dat dat spanningsveld heel sterk aanwezig is en dat het interessant is om daar een politiek debat rond te voeren en rond die verschillende projecten effectief een draagvlak te ontwikkelen concluderend een stad denk ik is geen land een stad is een hele wereld staat dichter bij de mondialisering staat dichter bij de reële complexiteit van de wereld en is dus een toegangspoort tot de wereld ik denk zoals ik in het begin heb gezegd dat de menselijke samenleving dat de menselijke soort een stadsdier aan het worden is we zijn daar niet voor opgeleid we hebben dat niet geleerd we hebben niet die mentaliteit we zullen nochtans die mentaliteit ons eigen moeten maken deze generatie of de volgende generatie want inderdaad de wereld zal er steeds mer gaan uitzien als een postnationaal knoop knopen netwerk van verschillende stedelijke gebieden waarin de activiteit zich zal afspelen waarin migratie en mobiliteit deel zullen zijn van het leven en waarin we dus permanent met aankomers met nieuwkomers zullen moeten samenleven en we moeten op die basis de menselijke samenleving herdenken in de stad is dat makkelijker omdat dat dichter bij de wereld staat dan dat in het land gebeurt dat eigenlijk naar het verleden is gericht deaandachtvan
|
9 |
+
4
|
10 |
+
t is drie maart tweeduizend veertien na een onrustige nacht word ik wakker en net als iedere dag check ik direct mijn tlefoon eerst kijk ik het nieuws kijk wat social media en uiteindelijk mijn mail dan loop ik naar de badkamer doe de deur open loop naar binnen ik kijk in de spiegel en ik zie mezelf niet staantien kilo zwaarder veel minder sociale contacten en een energienevel dat lager was dan ik ooit had gevoeld dat was wat mij gebeurde na een jaar werken in een corpusomgeving in al die zesentwintig jaar daarvoor had ik me beter gevoeld ik thijs die energieke jonge man vol levenslust naast mijn studie werkte ik ook zon vijfentwintig tot dertig uur in de week bij maar nooit had ik het gevoel dat dit mij ook maar enigszins belemmerde in het mooie leven je had zelfde keuzes een aantal colleges in de week werd aangeboden en daarnaast moest je maar kijken hoe het ging indelen uiteindelijk moest je je tentamens en je papiertje halen het doel was bekend en daaromheen had je ruimte en vrijheid om zelf keuzes te maken ging je wel naar die ene borrel of de je ht niet nam je wel dat ene bijbaantje of deed een niet volg je wel dat ene college of doe je het niet allemaal keuzes maar de vrijheid en ruimte om deze keuzes te maken je dat jezelf tot dat moment ik tekende mijn eerste contract en weet je na zeven jaar studeren en een wereldreis verder was ik er al klaar voor ik had er zin in maatschappelijke carrière tot die ene maandagochtend drie maart tweeduizend veertien de spiegel die mij vertelde tijsbenit dezelfde spiegel die mij vertelde dat ik jarenlang had geloofd in iets wat me altijd verteld was haal je studie vindt een baan en het leven lacht je toe diezelfde spiegel die mij op dat moment vertelde dat ik in iets geloofd had wat helemaal geen realiteit was diezelfde spiegel die mij vertelde dat deze manier van werken maar zoveel meer energie kosten dan dat het me opleverde en als ik ooit gezond en vitaal oud zou willen worden dat ik dit in ieder geval niet moest doen ik ben de spiegel tot op vandaag de dag van vandaag nog steeds dankbaar dat u me op dat moment heeft verteld want het aantal burnoutgevallen in nederland rijst de pan uit en is inmiddels beroepsziekte nummer één we hebben nog nooit zoveel chronische ziekten gehad als dat we op dit moment hebben ruim anderhalf miljoen mensen in nederland zijn eenzaam die hebben nauwelijks tot geen sociale contacten en meer dan één komma drie miljoen mensen slikken iedere dag antidepressiva en dan te bedenken dames en heren dat we honderd dertig jaar oud gaan worden honderddertig jaar oud vijftig procent van de kinderen die op dit moment geboren wordt wordt in ieder geval ouder dan honderd vijftig procent wat ik geleerd heb terugkijkend in de spiegel zijn er drie ontzettend belangrijke elementen in het lijventijd energie en middelen als j net als je op school zit of studeert heb je vaak wel heel veel tijd en energie maar het ontbreekt je vaak nog aan de middelen als je dat gaat weken heb je vaak wel middelen en ook wel energie maar het ontbreekt je vaak aan tijd en ook steeds meer maten energie en als we met pensioen zijn dan hebben we zeeën van tijd ook vaak wel wat middelen maar ontbreekt het ons aan de energie als je gezond en vitaal oud wil worden dan wil je toch je hele leven lang beschikken over tijd energie en middelen maar wij hebben een wereld gecreëerd waarin veertig uur in de week declarabele zijn standaard is en je moet ze ook nog maken tussen maandagochtend half negen en vrijdagmiddag vijf uur we hebben een wereld gecreëerd waarin drugzenonsstatus geeft als je niet druk bent dan vraagt iedereen zich af wat ben je daan doen zou je niet wat bij moeten doen we hebben een wereld gekeerd waar iedere dag filesfilesfiles leven beheersen we willen allemaal op dezelfde tijd op dezelfde plek zijn iedere dag weer we hebben het alleen maar over meer meer meer en beter beter beter in plaats van over duurzaam en uiteindelijk denken we nog steeds dat we van negen tot vijf werken maar eigenlijk werken van zeven tot zeven want vanaf het moment dat je s ochtends opstaat rent naar die douche rent naar de ontbijttafel rent naar het kinderdagverblijf om in de hoop niet aan te sluiten in de file en in de hoop om dan om negen uur aanwezig te zijn en hetzelfde kunstje om half zes weer een keer te herhalen dit is niet van nee tot vijf dit is van zeven tot zeven iedere dag weer en als je dan ook nog zeven of acht uur slaapt blijft er eigenlijk heel weinig over en dan te bedenken dat we eigenlijk weten dat tachtig procent van de mensen tegen een interne klok inwerktdatwe van werkdag op een werkdag van acht tot nepkantoor eigenlijk maar drie tot vier uur echt productief zijn en dat we weten dat negen uur per dag achter een computer zitten op een kantoor ongeveer het slechtste is wat je lichaam aan kan doen en toch houden we hieraan vast omdat het zo hoort omdat het hier nou eenmaal zo gaat w e hebben een werkwereld gecreëerd die ver weg staat van onze innerlijke behoefte en waar niet de mens maar de medewerkers centraal staat en de grap is we hebben eigenlijk de oplossing al in handen het ligt al dichtbij denk bijvoorbeeld aan de techniek ik herinner me nog als de dag van gisteren dat ik voor het eerst een mailtje binnenkreeg op mn mobiele telefoon ik dacht das handig het scheelt me hoop tijd en energie om een laptop open te kloppen de techniek moeten we omarmen de techniek zorgt ervoor dat we twintig voor seven kunnen werken en dat we niet fysiek aanwezig hoeven te zijn om een taak te volbrengen de techniek omarmen en voor je laten werken en mensen hier juist in te trainen creëren veel meer ruimte en vrijheid wij gaan nu regels opleggen wanneer we wel en niet mogen mailen maar ik kan u enig zeggen die techniek wordt alleen maar meer en laten we er alsjeblieft voor ons gaan werken we houden vast aan een systeem van vijftig zestig jaar geleden terwijl we totaal andere middelen tot ons beschikking hebben we noemen constant over work life balance maar eigenlijk dames en heren is toch gewoon het leven werk en privé is het leven waar we heen moeten en heel veel bedrijven noemen heel roepen heel hard het nieuwe werken maar ondertussen blijven we wel vasthouden aan aanwezigheid en controle ik ben wel gek vindt u niet we worden geleefd vanuit werk en niet vanuit vitaliteit en gezondheid want het is toch ook niet gek dat je soms effe geen zin hebt het is toch niet gek dat er soms effe niks uit je handen komt en het is toch ook niet gek als je een nacht slecht geslapen hebt dat het gewoon even niet lukt het is allemaal maar één ding en dat is menselijk als we de menselijke maat wat meer vooropstellen ervaren we veel meer ruimte en vrijheid en creëren daarmee een veel hogere kwaliteit van leven en dat kom een duurzaam bedrijfsresultaat altijd ten goede middagdutjes ja altijd doen bevoordeelt je creativiteit enorm en het is gewoon simpelweg beter voor je gezondheid overdag sport of bewegen ja doen bevordert je productiviteit enorm de doorbloeding in de frontale loop van je hersenen zorgt ervoor dat je een vel beter probleemoplossend vermogen hebt dat je veel initiatiefrijker bent en veel gemotiveerder bent andere dingen oen een keer tussendoor op een werkdag boodschappen winkelen keer lunchen met je vader moeder opa oma allemaal doen deze vorm van vrijheid en ruimte geeft je zoveel meer productiviteit op de momenten dat je wel aan het werk bent daar wordt iedereen beter van en het scheelt je vooral ook hele lange rijen bij pashokjes op zaterdagmiddag de casa de sportschool s avonds om zeven uur waar geen toestel meer te krijgen is het heeft eigenlijk alleen maar voordelen maar wij hebben een wereld gecreëerd waarin de belangrijkste waarden in ons leven tijd voor je gezin je omgeving en sociale contacten onder drugsaanko te staan de wereld waar mensen de laatste dagen van de vakantie beginnen af te tellen omdat het zware normale leven weer gaat beginnen en waar een grote groep mensen zich op zondagavond zo slecht voelt omdat ze op maandagochtend weer moeten gaan werken en een wereldwip druk en geen tijd ongeveer de meest gehoorde stopwoordjes op een gemiddeld kantoor zijn dit is niet nodig door tijd energie en middelen anders te verdelen autonomie te stimuleren mensen hier juist in te trainen erven we veel meer ruimte en vrijheid en verhogen hiermee de kwaliteit van leven van iedereen alleen wij kunnen gezamenlijk een wereld creëren met minder benoud minder chronische ziektes minder eenzaamheid en minder antidepressieventen week heeft honderdachtenzestig uur als je er daarvan ongeveer vijftig slaapt en ongeveer veertig werkt betekent dat er nog achtenzeventig over zijn das bijna drieënhalve dag als je dan morgenochtend wakker wordt en ook in de spiegel staat te kijken vraag jezelf dan eens af wat heb ik nou nodig voor een hogere kwaliteit van leven en bespreek dat nou gewoon eens met je werkgever met je collegas want samen vinden jullie een weg die het voor echt voor iedereen beter maakt wat zeggen nou zelf welke werkgever willen nou geen positieve energieke en warme collegas mij bevalt het als werkgever in ieder geval fantastisch en ik zou echt nooit van mijn leven meer anders willen wie van zit in een zaal en denkt dat is leuk verhaal onhaalbaar kan heel slecht zien maar toch weinig hier ja eentje ja dat is toch leuk nou vijf jaar geleden hebben wij op deze plek een bedrijf gecreëerd met massagestoelen met sportfaciliteiten met een vierdaagse werkweek met onbeperkte vakantiedagen en dames en heren ook wij groeien al vijf jaar oprij en geloof me wij zijn ook niet het enige voorbeeld er zijn er echt meer echt waar wij zijn niet de enige als je nou morgen wakker wordt en je praat hierover met je collegas en andere mensen dan gaan jullie het voor iedereen net een klein beetje beter maken dank u wel
|
11 |
+
5
|
12 |
+
negentien tachtig ik was tin elf jaar en één ding wat ik het liefst deed samen met mijn broer was strips lezen we hadden hele stapels thuis en mijn lievelingsstrip was lucky luklukiluk met zijn witte hoed de grote redder strijder tegen het kwade en die die had altijd oplossingen dat was een fantastisch event en tegen wie streed die wat wat was zijn grootste tegenstander de daltons altijd een een grijze of een donkere hoed marnie het was altijd duidelijk en het was eigenlijk hetzelfde als je vroeger de oude westers op tv zat die zwartwit serie zat je bonanza en rohit en dan had je altijd de de slechteriken met de zwarte hoed en de goede rikke met de wiethoeden wat maakt het eigenlijk heel makkelijk goed slecht je wist van tevoren precies waar je aan toe was en aan het eind van het verhaal zag je ze altijd tegen de zonezonnegang inrijden op oek naar een volgende avontuur en die keren nog goed uit ook ik ben rob rob vragen ik ben een trotse vader een partner een levensmiddelentechnoloog en ik werk bij de grootste chocoladefabriek van de wereld en daar ben ik best trots op maar ik heb een probleem wij hebben een probleem jullie heben een probleem we zijn te dik wie heeft er een paar kilootjes te veel ik ik zie wat voorzichtige vingertjes ik zal de vraag anders stellen wie denkt er dat zn partner een paar kilootjes te veel heeft ja nou dan krijgen we al een beetje in de gaten en en en das en probleem en dan praten we over kilos teveel we praten over overgewicht maar waar je ook over praat als je te veel overgewicht hebt dan dan heb je last van obesitas zwaarlijvigheid en obesitas zwaarlijvigheid is we zien dit vaak als een cosmetisch probleem dat is geen probleem wat dat betreft het is het verhoogt de risico op hart en vaatziekten verhoogt die risico op diabetes twee en het verhoogt de risicobegingsprobleem en dat is wel een probleem nou we zijn met zn allen daarmee bezig als we nou praten hoe groot is dat probleem dan laten we ns even kijken we hadden straks al erover hebben zeveneneenhalf miljard mensen op de aarde een komma negen miljard daarvan die hebben last van overgewicht e zeshonderd miljoen hebben last van obesitas nou dat zijn zulke grote getallen dat is heel erg veel en sinds negentien tachtig is dat verdubbel wat betekent dat nou wereldwijd eigenlijk de twaalf mensen maar in nederland is ongeveer wij zijn hier nederland de bv neland nou dit is de zaal nederland vijftig procent van de mensen in nederland hebben last van overgewicht dus jullie helaas hebben last van overgewicht en een op de zeven mensen in nederland veertien procent hebben last van obesitas en das dan zeg maar ongeveer deze groep mensen hier dus als we daar straks op terugkomen dan weten we ongeveer hoe het verdeeld is maar hoe groot is dat probleem nou hoe complex is dat probleem is een onderzoek geweest in engeland en die hebben dat heel eenvou in kaart gebrachte danaan snap je het al van dr zijn dus heel veel factoren die daarvoor daarmee van invloed zijn en dat varieert van opleidingsniveau beschikbaarheid van gezond voedsel maar ook is het veilig om op straat te fietsen en te wandelen en en ook de hoeveelheid stress en er zijn heel veel factoren die daarop van invloed zijn uiteindelijk hier zeg je dus er zijn ongeveer acht sectoren honderd acht sectoren of elementen dus t is complex en je kan ook voorstellen als je één van de zaken aanpakt dat je daarmee het probleem niet hebt weggenomen maar het mooie is dat eigenlijk in het centrum dan zie je het belangrijkste dat is e energiebalans en het engels zeg is dat heel mooi if je eet het bejudoontbern het u zetanen das duidelijk maar terugkomen het is dus een complex probleem wat je wel ziet is dat iedereen daar toch een eenvoudig antwoord op hebt nou laat ons gaan kijken een hele mooie een hele mooie quota voor erie complex problem daar is een anse dat is kleer simpel en rong en en dat komt ook wel een beetje terug in de uitdagingen die wij krijgen nou voor voor deze helft van de zaal jullie hadden last van overwicht wat doe je dan nou dan gaan w naar de bibliotheek of we gaan naar de boekhandel nou laten we online is een boekje gaan bestellen dieetboek das de makkelijkste oplossing hoeveel dieetboeken kun je online bestellen je gaat nu naar bol dat kon iemand een idee ik hoor ik hoor vijf tegen hoor tweehonderd nog iemand anders tweeduizend het zijn er drieduizend eenennegentig in nederland ja dat erstaat als we nu gaan kijken want mooie boek ik als vol maar we zitten inmiddels op de wereld hadden heel veel mensen dan gaan we op de grootste online boekstro gaan zoeken hoeveel boeken die eet boeken kun je online bestellen we hadden nederland drieduizend zullen er meer zijn dan iemand anders een idee ik hoor daar vierduizend een beetje meer jongens tienduizend ik haal je uit de brand tweehonderd twintigduizend vijfhonderd achtenveertig vorige week misschien dat het deze week wel meer zijn dus je ziet ook daar dat het een complex probleem is want zelfs als je een oplossing zoekt dan weet je eigelijk nieteens wat je moet beginnen en daar zit dus de uitdaging want die uitdaging zit hem ook in van die is complex voor de consument is ook complex voor de procent nou als we gaan kijken dan we denken vaak in goed en slecht we hadden net al richtlijnen gehad laten we ns even gaan kijken goed slecht zout iemand idee goed of slecht slecht ik ja kon slecht naar slecht heb zout moeten we minder eten maar we moeten niet vergeten als je geen zout hebt dan ga je dood dan is t best lastig een andere transvetzuren goed of slecht ik zie een aantal mensen een beetje glazig kijken transvetzuren gedeeltelijk haarde vetten goed of slecht nog steeds blanco gezegd slecht ik zou zeggen slecht en het mooie van transvetzuren leek te zijn dat je harde vetten kon krijgen bleek echter dat dat slecht was voor je gastrol en het mooie is dat de industrie die inmiddels uit het grootste gedeelte van onze producten al heeft gehaald en jullie wisten het niet eetsenlaatste dan laat ns even kijken emmertje drin slecht iemand anders eland is citroenzuur citroenzuur zit in elke levenseln je van je lichaam maak jezelf aan fantastisch product dat kun je heel mooie dingen mee doen maar je ziet dus ook daar het is verwarrend het is complex want wat moeten we daar nou mee laten we nog eens een andere pakken eens even kijken ik zag deens even weg portie groter wehebben allemaal onderweg willen een keer iets iets drinken zijn we onderweg en dan kunnen we kiezen altijd uit klein standaard of groot nou das mooi wat kiezen we dan het onderzoek is getoond aangetoond dat we eigenlijk allemaal gemiddeld tussen klein en standaard kiezen nou dan heb je heel mooi maar wat hebben we inmiddels gedaan we hebben klein standaard en groot en welke kiezen we nu ja weer tussen klein en standaard in want we willen iwilleneelijk niet klein willen ook niet extra gooide gewoon eigenlijk normaal zijn maar een van de dingen die we vergeten zijn is dat toen we vroeger bij onze oma een kopje te gingen denken wat was toen de maat das een mooi schoteltje mooi oortjetoen was dat de standaardmaat dus wat we zien is dat eigenlijk die maten we weten het eigenlijk niet meer precies we willen allemaal standaard maar wat is nu standaard dus die keuze die moeten we zelf maken en dit is niet iets van de laatste twintig jaar er is namelijk heel mooi onderzoek geweest door wasingesink in amerika en die hebben de belangrijkste de beroemste maaltijd alle tijden hebben zij onder ogen genomen het laatste avondmaal tweeënvijftig schilderijen hebben ze bestudeerd over duizend jaar dus we hebben een historie van duizend jaar in maaltijden eens bekeken en ze hebben ook daar gekeken naar de portie grote ook naar andere zaken maar hoeveel denken jullie dat die portie groter gestegen is in duizend jaar na vijfenzestig punt vijf procent dus u ziet ook dat het niet iets van de laatste jaarniet wat heel lang al gaande is wat is er echter de laatste dertig veertig jaar gebeurd is die maaltijden zijn vergroot maar wij zijn minde gaan bewegen en dan komen weer terug op die energiebalans wiens bordje ligt het nou no de landse beroemd tijdschrift heeft een hele mooie series gepubliceerd de obsityseries en die hebben daar ook naar gekeken en die kijken eigenlijk naar verschillende rollen we hebben de overheid we hebben het individu wij de scholen de retailers de supermarkten en de producenten en die hebben daar allemaal een rol in te spelen en het is daarom ook heel belangrijk dat wij als als consument als individu moeten we die rol nemen maar als industrie is het belangrijk dat dat we die rol nemen en ik als levensmiddel toch technoloog staat ervoor maar het mooie is dat we die rol ook al hebben genomen alleen vaak niet zichtbaar zouts verlaagd transvetzuren zijn eruit gehaald verzadigd vetters verlaagd portie groters verlaagd we hebben hele andere labeling dan voorheen maar ook de allergenen zijn veel duidelijker gelabeld en en daar heel veel richtlijnen voor gedaan en belangrijk is dat heel veel van die nieuwe richtlijnen die zien jullie niet sinds tweeduizend tien hebben wij onze portie grote gemaximaliseerd op tweehonderd vijftig kilocalorieën maar heel vaak zien we dat niet maar het is belangrijk dat die dat die zelfregulering die werkt en dan moeten we mee verder gaan maar goed das allemaal mooi kop vragen wat wat ga jij daarnou aan doen ja das een das een mooi want ik wil graag dat onze producten alle producten in het schap dat die beter worden wat betekent nou beter als we nu terug gaan kijken naar die zoutverlagingdie zoutverlaging als je die te snel doet wat doen we dan als consument dan zeggen we oh dat product smaakt anders willen we niet meer of we doen er thuis we zout bij dus des lastig dus als levensmiddelenindustrie moet je dat dan heel langzaam doen tegelijkertijd zien we ook dat wij als consument vaak een gedragspatroon hebben wat lastig is er is een interessant onderzoek geweest in frankrijk door professor chandon en die heeft zonder dat wij dat wisten heeft die snoepjes besteld in in een in een mooie winkel en die heeft eigenlijk dingen op laten drukken die heeft er op een aantal heeft die standaard laten drukken en op een aantal anderen heeft die light of loofvent laten drukken dat light loofvent en dit soort levensmiddelen betekent dat er dus dertig procent minder vet inzit dan zit er wel dus iets anders in maar wat hoe denk je dat de consument dan reageert als je de consument een keuze gaat maken moet ik een portie pakken dan pakken ze eigenlijk een normale portie van standaard ongeveer honderd tweeënnegentig kilocalorieën nou is een mooie portie als je echter vervolgens de consument die ligt of lovat gaat pakken dan gaan we meer pakken en de snoepjes zijn die anders dat was alleen mar loofvetopgedrukt dus dus wat je ziet is dat onze keuzes of menselite of loofveteproduct hebben in plaats van e zeggen van das mooi dan heb ik een voordeel want dan krijg ik minder kilocalorieën nee dan is ons gedrag dat we meer gaan eten en in deze studie was het uiteindelijk achtenveertig of zesenveertig procent meer dus das lastig dus herformuleren moet je langzaam doen maar als je doet en je communiceert het op de verkeerde manier dan gaan mensen niet minder eten dan gaan ze juist meer eten nou hoe zit dat nu met chocolade chocolade iedereen negen van de tien mensen houdt van chocolade de tiende persoon ligt meestal zeggen ze ook wel eens maar chocolade is geen maaltijd vervangen het is geen dagelijkse snek het is t is we proberen gingen zonder chocolade te verkopen het is geen brokkelie het zijn geen worteltjes het is een traktatie en ik denk dat is belangrijk dat we moeten moeten zien en daarom staan wij ervoor dat we meer kleinere porties willen aanbieden is nu mijn aanbeveling aan jullie als levensmiddelehnoloog als als individu als consument nou eigenlijk is die baan aanbeveling heel erg simpel stap éénvan mind les naar mind fuel dus een goed nederlands gaan graaien en snaaien naar genieten en das wel belangrijk want we eten vaak meer dan dat ons plezier geeft we eten door voor meer eend uit gewoonte of uit rituelen of dat het het lijkt gezellig maar uiteindelijk als je eet voor je plezier en voor je genoot zorg dan dat je het mindfuldaarvan geniet en de tweede uitdaging en dan komen we hiernaar terug wat is jouw standaard kies jouw standaard want als ze allemaal een maandje kleiner kiezen wordt vanzelf een maandje minderopbezetas het is een complex probleem we moeten er samen aan werken en het ligt op verschillende bordjes zeg ik best een gek woord consumeer het gaat juist in dit geval om minder het gaat om meer genieten is bijna lunchtijd ik ben benieuwd wat er dadelijk op jullie borden
|
13 |
+
6
|
14 |
+
en pietenschoogie op het podium om jullie mee te slepen in het verhaal van mijn leven en het verhaal die gaat over klassieke muziek voor iedereen en niet voor een hele kleine groep ik ga jullie laten zien hoe klassieke muziek voor mij een avontuur is geweest dat eerst heel persoonlijk was en daarna een passie was die ik ging delen met hele grote groepen uit het publiek en tot slot dat is mijn huidige missie zorg dat iedereen in de werel toegang heeft tot klassieke muziek en het gaat waarderen het is ooit ergens begonnen natuurlijk dat was helemaal niet zo niet ik was hem niet niet zo jong dat ik aan klassieke muziek begon het was pas eenentwintig en dat was iets wat ervoor zorgde dat dat de vlam in de in de pan sloeg ik ging muziekwetenschap studeren en ik had er helemaal geen verstand van maar dat was iets en toen ik muziek ging studeren toen ik ja ik moet toch ergens beginnen met luisteren en mijn broer die toen in amerika woont die zei rob ik ga een beetje meeluisteren we gaan beginnen met koestafmalig nooit van gehoord zijn zevende symfonie kopen maar en dan gaan we alle twee luisteren nou zo gezegd zo gedaan we gingen naar koestamalgsamen luisteren en dat sloeg in als en bom kijk dat ging zo hier is een schitterende uitvoering van claudia abado met het lezen festivalorkest dit was een een bliksemflits er gebeurt iets met me wat nog nooit in mijn leven was gebeurd en wat was er dan precies maar om het goed te kunnen uitleggen gaan we een paar stapjes erug dit was de mokerslag maar ergens is het natuurlijk met mij begonnen zoals het bij iedereen begonnen is ik heb een voorgeschiedenis ik ben opgegroeid met muziek helemaal niet klassiek zoals eigenlijk iedereen dat dat heeft gehad laat ons even door mijn elpee cdtjes heen lopen van het begin de beatles kan niet anders zes jaar mijn moeder maakt een enthousiast elton john kan daarachteraan heerlijke muziek eerste alp die ik die ik kocht maar er was natuurlijk veel meer moois de egels toen was ik twaalf drie volop genieten koering elektrik leadoff zon een beetje klassiek maar prachtige muziek stevie wonder wie heeft er niet van genoten van songs en deke of life maar er kan nog veel meer achteraan popmuziek was mijn inspi pretzels logic stelden dat was de volgende fase megazaak terug bij de beatles want de beatles is en rode draad in mijn leven dat is de klassieke muziek van van de popmuziek dus das een beetje mijn voorgeschiedenis maar wie heeft er nou voor gezorgd dat ik gepassioneerd werd moet ik al de juiste slijter hebben mijn vader mijn vader was een groot liefhebber van marsmuziek en ik zie hem nog zo staan die zit hier achter zijn saxofoon ik zie hem nog zo staan in de kamer als franksenatere opstond en dan stond ie te swingen met de bigband en hij dirigeerde de bigband in de kamer en de kouwe rillingen liepen over zijn rug dat was nog eens passie van hem heb ik geleerd wat passie was maar ik kreeg ook de gelegenheid van mijn ouders om muziek te maken daar ben ik ze heel erg dankbaar voor hebben een paar voorbeelden ik mocht bij piande gitaarles krijgen die heb ik gespeeld dat kon ik toen echt helemaal in het begin toen ging ik orgel spelen emil simons demuziek van jimmy smith een beetje jasnoch heb ik het nooit geleerd hoor maar toen maakte ik de sap naar klassiek piano mozart is een eenvoudige symfoniesimpele kan niet mar mooier kan bijna ook niet dus ik ik had wel een geluk ik mocht ik mocht muziek leren van mijn ouders en vervolgens dacht ik als ik hier kijk ik heb een stuk geschiedenis ik heb passie ik heb wat geleerd maar omdat te zeggen dat ik er wat van wist nee ik wist helemaal niks net als heel veel andere ik had geen verstand van muziek daarom ben ik muziekwedenwetenschap gaan studeren en dat was een grote avontuur ik ga jullie een beetje meenemen in wat het avontuur de ontdekkingstocht door de klassieke muziek nemen eventjes de tijd voor dat vind ik belangrijk ik ga nu heel veel kouder relingen krijgen en ik hoop dat jullie ook een paar ouderlingen gaan krijgen dan komt ie de ontdekking van de klassieke muziek monteverde de maria vespers muziek rond zestienhonderd tien mooie kan bijna niet bij mijn rollen en de leraren bij muziekwetenschap namen allerlei muziek voor me mee de noten kraken van jakowski balletmuziek ik had er nog nooit van gehoord zo mooi ik wist niet dat het zo mooi was van te denken van bach de brandenburgse concerten ook weer een van mijn eerste klassieke alpes volop van genoten hier comartimentoconcert uit amsterdam of via de vertaling van het hart de vertaling van de menselijke stem op een instrument hier in tais massenet prachtig uitgevoerd door joshabewakner schrijft operas van zestien uur zoals de walkuren redhorn hier heftige muziek ook vaak een film gebruikt de massage we kennen hem allemaal t is music voor de miljons maar hoe mooi ik leerde de amerikaanse muziek kennen gorge cursin later john adams een american in paris sensationelen wie kent deze opening niet dat kennen we allemaal de beste opening ooit geschreven beethoven hoef nieten we krijgen de volgende de ritorspringli zakreduprentan honderd jaar geleden exact honderd jaar geleden een sensatie slachtoffers bij de eerste uitvoering de politie moest het podium opkomen omdat publiek het podium op rende om de musici en de blean te belagen of de hemelse koormuziek uit de renaissance giovanni palestrina met zijn misa papa marchelli het kon niet anders de passie was geboren maar de ontdekkingstocht ging verder ik wilde meer ontdekken en er is een heel mooi moment in mijn leven en het moment is dat ik met vrienden ging fietsen in de dordogne en daar waren in sarlat een heel mooi middeleeuwse stad en in sarlat dat was een daar zat in de kerk en de kathedraal was er een orkestje en dat was zat een pianist we we liepen de zomer naar binnen ik ging zitten en ik werd wederom eens mokerslag getroffen door opening van het twintigste pianoconcert van mozart is imsorry moet onderbreken want er is nog veel meer te vertellen dus de muziek was goed bij mij binnengekomen en nu gingen we op bedevaartstocht ik samen met mijn vrouw we gingen naar wenen want motatenmalen dat waren de componisten ja die helemaal in mijn gestel zaten we gingen naar wenen om te ontdekken waar ik geboren was waar ze gewerkt te hebben wat er allemaal gebeurd was en het was een prachtige ontdekkingsreis maar er was ook een botsing tijdens die reis we gingen naar de naar de muziekvormen tempo net als het concertgebouw prachtig concertzaal en toen hoorden we de vijfde symfonie van broek naar terug naar ons appartementje in de in in de tram zei ik tegen mijn vrouw dit is toch echt het allermooiste wat we ooit hebben meegemaakt en ze kijkt me aan en zegt wie kan er nou van broek naar vijf houden dat is toch verschrikkelijk er bestaat geen mens op de wereld die dit mooi kan vinden we hebben een echte vlammende ruzie gehad en ik dacht van oh dus wat ik zelf beleefd het is niet vanzelfsprekend dat ieand anders dat ook beleefd ik was totaal verslaafd maar het wilde niet zeggen dat andere mensen die verslaving hadden het was dus een privé ervaring alles was nog persoonlijk wat ik wat ik meemaakte totdat ik ging dirigeren en lesgeven dat was het moment dat ik muziek ging delen met anderen een nieuwe fase in mijn leveneerstcoor directie ik mocht tijdens mijn studie mocht ik cora gaan dirigeren geweldig met vijftien zestien twintig dertig zangers koormuziek beleven moet voorstellen dat je met mekaar deze muziek maakhet salve regina van francis poolinwat een gelukzalige ervaringspunten ik mocht orkestdirectie gaan studeren de examen trouwens met hanswellen in hilversum en we kregen de kick van het dirigeren van vijfenzeventig mensen samen muziek maken ech tot hele hoog tot een heel hoog niveau ko komen dat was dat was fantastisch maar lesgeven onderwijzen dat was nog een in volgende fase want dan sta je voor een groep mensen en dan mag je enthousiasme en dan mag je kennis overbrengen op anderen dat is geweldig ik merkte toen tijdens dat lesgeven dat ik niet alleen zelf kouwerillingen had maar dat ook de mensen die met mij dat deelden dat zij ook ouderlingen kregen ik weet nog zo goed ik gebruikte altijd aan het eind van mijn cursus gebruikte ik het klarinetconcert van ozartdar is mozart weer en met dit klarinet van concert van mozart gebeurde met iedereen wat met mij gebeurde kauwringen morgen speelt door carol lister jaren geleden en ik ik heb hem weer gevonden hij staat ook op cd een prachtige uitvoering ik deed wat ontdekkingen ik deed wat ontdekkingen ik ontdekte dat klassieke muziek een universele taal is het is niet alleen voor mij het is niet alleen voor degenen met met wie ik met wie ik deel ook in china ook in afrika ook in amerika overal als je je best voor doet kun je ontzettend genieten van klassieke muziek omdat het een universele taal is wat ik ook ontdekte is dat als je de taal leert begrijpen en als je daarnaar luistert en vaker luistert dat het je ziels gelukkig maakt maar dan moet je wel echt heel erg je best wel doen dat gaat niet vanzelf popmuziek dat wordt geplukt dat hoor je veertig keer en dan denk je is een leuk liedje klassieke muziek hoor je één keer ja wat weet je dan nog moet je voorstellen dat je een klassiek nummer veertig keer hoort dan komt dus veel verder dan de popmuziek natuurlijik kreeg een missie en mijn missie was ik wil de klassieke muziek toegankelijk maken voor iedereen niet beperkt tot een kleine elitaire groep maar voor iedereen dat is mijn missie geworden in mijn leven en op dat moment was ik natuurlijk nog bezig met de liefhebber maar om iedereen enthousiast te kunnen maken moest ik kunnen uitleggen wat nou bijzonder van klassieke muziek was en dat vond ik heel erg moeilijk ik kon mooie verhalen vertellen dat ging allemaal wel vanzelf maar wat is nou het bijzondere het magische van de klassieke muziek en dat zag ik voor het eerst toen ik de speelfilm amadeus zag amadeus is voor mij de allermooiste speelfilm over klassieke muziek kijk maar beginsalaris grote vijand bessenstuk beschrijft zo bijzonder is eoalsinglnoot hanging deranweveringan tillar net toetert mooi kijkt de hele film en u bent en u bent overtuigd dus toen wist ik ook een beetje dat je het kon uitleggen wat zo bijzonder was aan klassieke muziek ik ontdekte dat storytelling verhalen vertellen uitleggen davor zorgde dat de anderen ook allemaal enthousiast werden ik ging het dus delen met liefhebbers en dat deed ik als volgt eerst voor mezelf dat weten we vervolgens ging ik onderwijs groep van tien twintig dertig vervolgens ging ik dirigeren er waren nog meer twintig tot tachtig mensen ik krijg de kans om bij kranten te gaan schrijven nou dan bereik je twintig dertigduizend mensen die proberen allemaal enthousiast te maken of nou om kritiek of om een negatief positieve kritiek gehad vervolgens natuurlijk de symfonieorkest ik heb jarenlang vor orkesten mogen werken geweldig daar zaten tweeduizend mensen in de zaal of bij het kerkje festival in rotterdam kwamen vijfentwintigduizend mensen naartoe geweldig steeds meer mensen kijken met me mee maar dat is een hele belangrijke het was nog steeds klassieke muziek voor de happy few het was beperkt tot mensen die het hadden meegekregen goed moest dus nog een stap worden gemaakt hoe krijgen we nou voor mekaar dat klassieke muziek voor de massa is voor iedereen toegankelijk werd een eerste stap daarin was mijn kennismaking met peter crone peter crone was een man die organiseerde operas in ahoi hij noemde dat stadionopera's k heb met hem mogen meemaken hoe hij in voetbalstadions in parijs in changhai in stootkar voor tachtigduizend mensen aia carmen traviatenbracht op een zeer hoog niveau de mensen genoten allemaal ontzettend dat was dus klassieke muziek voor een hele grote groep mensen en ze genoten net zozeer als de mensen in het concertgebouw klassieke muziek was dus ineens voor iedereen mar nog lang niet genoeg ik stopte bij de orkesten omdat ik dacht ja ik ben altijd voor mijn eigen zaal bezig maar dat publiek zit wereldwijd er zijn miljarden mensen die die er nog niks van af weten en technologie was hetgene wat mij kon helpen om iedereen te gaan bereiken allereerst was daar breedband ik ben dus met het internet aan de slag gegaan en vanaf negen tweeduizend zes via een een een groot portae opzetten dachten we dat breedband gaat ervoor zorgen dat iedereen ervan gaat genieten maar ja eps bestonden nog niet avons bestonden nog niet was hartstikke moeilijk bijna niemand de mee maar ik wist wel dat daar heel veel potentie zat en toen mocht ik terugkeren naar de oude wereld ik ging naar de televisiewereld en dat is heel interessant want je kunt hele mooie klassieke muziek kun voor grote groepen brengen als een opera in nederland doet al gauw vijftig tot honderdduizend mensen op televisie het mooie programma mastro wat onlangs door de avro is gemaakt dat bracht een komma vier miljoen mensen voor de televisie dat zijn hele grote aantallen en ze hebben allemaal enorm genoten dus televisie al is een heel belangrijk medium maar de nieuwe media is natuurlijk veel meer dan breedband en dan televisie want als je een hele mooie opname maakt kun televisie brengen je kunt dvd van maken je kunt tegenwoordig via vireemand kun je bestellen en bekijken tub is het het kanaal voor de klassieke muziek geworden maar de metropolitan opera brengt klassieke muziek in de bioscoop daar zitten van wereldwijd tienduizenden sterker nog de beste voorstelling bracht vijfhonderdduizend mensen wereldwijd in vijfduizend bioscopen om naar een opera te kijken dat is sensationeel dus de nieuwe media was een enorme en enorme hulp geworden om klassieke muziek te helpen en ik zeg de nieuwe media is de grootste kans die de klassieke muziek in achthonderd tijd achthonderd jaar tijd heeft gekregen want de nieuwe media zorgen ervoor dat klassieke muziek nu echt toegankelijk is voor iedereen maar daar moeten wel wat voor doen en we gaan nu naar de eindstreep toe want wat moet je dan doen storytelling is het noodzakelijke virus je moet er meer voor doen omdat je moeilijk kunt pluggen dus je moet heel veel verhalen vertellen dat doe ik niet alleen dat doen heel veel mensen over de hele wereld zoals lennart burnstein vroeger michael tilson thomas of in nederland onze eigen jan willem de vriend die dat heel vaak doet via via de wereld draait door en andere media de nieuwe media moeten we heel goed gebruiken als distributie-instrument en dat doen we en we bereiken al heel veel mense mee maar voor mij zit de toekomst bij de jeugdorkesten jeugdorkesten dr zijn er wereldwijd duizenden van n ommeer hebben ons eigen al meer jeugdsymfonieorkest we hebben het utrecht studentenconcert in in in in utrecht hebben het vuurorkest daar zijn in nederland driehonderd jeugdorkesten wereldwijd zijn er een paar honderdduizend jeugdorkesten en zij brengen een enthousiasme oer wat echt ongekend is ik wil ook gaan afsluiten met de hoop voor de toekomst die in deze drie elementen zit maar vooral in het jeugd even kijken tot slot naar een heel bijzonder fragment van het simon bolivar jeugdorkest uit venezuela geleid door gustavo dudamel dan is klassieke muziek een echt feestje de opening van een nieuwe zalalleenja zo is de klassieke muziek natuurlijk echt heel makkelijk bij een heel groot publiek te brengen heel raar maar de hoop voor de klassieke muziek en die is heel groot die begint dus op dit moment in venezuela bij de jeugdorkesten zijn er tweehonderd in venezuela en ik hoop dat u samen met mij ervoor gaat zorgen dat we het allermooiste geluid wat de westerse beschaving heeft voortgebracht bij miljoenen over de hele planeet kunnen brengen dank u wel
|
15 |
+
7
|
16 |
+
droog een vlijende introductie ik hoop dat ik hem waar kan maken mijn presentatie heeft de leerling en ik en de leerling staat voorop natuurlijk in mijn ogen wie ben ik even heel kort is eigenlijk al gezegd frans droog ik ben docent gewoon docent zeg ik meestal biologie en mensenater dat is op het wolvenliceum een daltonschool in berghoek vlak bij rotterdam naast docent zijn ben ik ook bestuurslid van de kraut een organisatie die vindt dat docenten regie over hun eigen professionalisering moeten nemen en die heeft als basis docenten weten het beter dus kunnen ook goed van elkaar leren daar heb je geen experts voor nodig soms maar heel vaak niet ik ben organisator geweest van het eerste hetkamp in nederland en ook van het tweede dat is een primeur misschien die gat in februari tweeduizend vijftien plaatsvinden dus hou de sociomide in de gaten een aanrader hoor ik van veel mensen ik ben ook deelnemer aan united voor education dat is een initiatief wat alle positieve ontwikkelingen in het onderwijs gericht op vernieuwing vooral wil verbinden en zo versterken er zijn ontzetend veel initiatieven die van elkaars bestaan niet weten als je dat bij elkaar brengt kan dat een veel grotere stem krijgen dat willen wij gaan doen en mijn daar zijn een aantal transitieparen en mijn speciale transitiepand zal zijn de leerling ik heb ooit op een cursus geleerd dat je je visie moet tonen uitspreken dit is mijn visie zwartwit nee dit is een plaatje over evolutie kun je ontzettend veel plaatjes over vinden wat ik hiermee wil aangeven is ik vind evolutie is mijn favoriet onderwerp denars mijn favoriet onderwerp als bioloog erfelijkheid alles wat daarmee te maken heeft en je ziet hier wij stammen af van een organisme waar apen ook van afstammen wij hebben leren lezen en we kunnen nu dingetjes op computers den maar wat gaat er nu vervolgens gebeuren nou op menselijke schaal één mens gaat de evolutie niet meemaken maar dit plaatje staat ook symbool voor mijn visie op onderwijs het onderwijs verandert ook tenminste ik vind dat het moet veranderen omdat de samenleving verandert de leerlingen van nu hebben zo ongelooflijk veel informatiebronnen moeten zo ongelooflijk veel keuzes maken dat wij hun daarin moeten begeleiden wat er ove twintig jaar nodig is aan kennis weten wij niet dus ik denk dat het handig is om kinderen te leren die kennis zelf te gaan vergaren want het zou zomaar kunnen gebeuren dat de evolutie deze richting opgaat iedereen gaat muziek maken geweldig nummer van puljemoveren het zou kunnen dat dit gaat gebeuren we gaan allemaal nog meer eten en het onderwijs kan daar invloed op uitoefenen denk ik en ik vind dat ik dat zoveel mogelijk moet proberen en ik wil dat heel graag delen ik ben begonnen als onderzoeker als moliculaire bioloog en ik heb echt met zon raar ding in mijn handen gestaan daamee kun je dna aflezen gaat tegenwoordig met machientjes die onderzoekshouding die ik daarvandaan heb overgehouden kwam mij van pas en zat mij in de weg toen ik docent werd want ik kwam op een school en ik zei waarom doen jullie dit eigenlijk zo kan ik vinden dat dat hoe dat werkt waarom dat werkt en het antwoord was meestal dat weten we eigenlijk niet ik zeg maar zou het niet zo en zo kunnen dat weten we eigenlijk niet dus ik heb altijd die onderzoekshoning behouden en ik probeer altijd te kijken wat werkt en wat kan ik toepassen wat ik ook geleerd heb is als je niks verandert verandert er niks dat kun je op een tegeltjeswijsheid lzen als als je doet wat je deed krijg je wat je kreeg en ik denk niet dat dat goed is voor onze leerlingen ik denk niet dat het goed is voor onze samenleving als wij steeds hetzelfde blijven doen bijvoorbeeld gebruik van technologie verandert de samenleving gigantisch dat gaat steeds sneller dus daar moeten we iets mee vind ik een van de dingen die mij ontzettend stoort in het onderwijs is dit vrij bekende plaatje wel denk ik maar laat hem toch zien alle leerlingen worden op dezelfde manie getest hoe verschillend zou ik zijn nou hier moeten ze de boom inklimmen en wat mij betreft kun je met dit soort dingen de boom inklimmen dat is niet handig niet alle leerlingen kunnen hetzelfde niet alle leerlingen hoeven hetzelfde te kunnen niet alle mensen hebben hetzelfe beroep niet alle mensen hebben dezelfde kennis nodig om dat beroep goed uit te voeren nou is allemaal wel leuk zon quoten die plaatjes natuurlijk maar waar moet je daar nou mee nou ik probeer dat toe te passen ik heb een aantal dingen hier opgeschreven die ik in mijn dagelijkse lespraktijk toepas de bovenste twee zal ik wat meer over vertellen later ik slaat even over flipping de klas room is ik weet niet hoe bekend het is heel simpel gezegd de directe instructie haal je uit het klaslokaal doe je vooraf door het op te nemen of hoe dan ook en dat betekent je hebt meer tijd in de les als je meer tijd hebt in de les kun je iedere leerling meer tijd geven individueel je kunt andere activiteiten doen dus de les wordt efficiënter effectiever besteed dan moet je wel van tevoren bedenken hoe je dat gaat doen een filmpje opnemen en zeggen kijk maar dat werkt niet maar het principe werkt heel erg goed ik ben onderzoeker dus ik heb het onderzocht in mijn geval leverde dat een verhoging van het wiskundegeschijver van een half punt dat is redelijk hoog vind ik ik lees ook het nodige en praat daar regelmatig met docenten over en het verbaast mij en jullie doen dat natuurlijk allemaal ook dus ik weet niet wat jullie hoe vertellen maar het verbaast mij hoe weinig docenten dt doen en hoe weinig zij dat gebruiken hele simpele trucjes die je lessen efficiënter maken met zijn twee achter de computer is efficiënter als ik dat vertel op mijn school zeg dani nee dat helemaal niet aan dan gaan ze kletsen het klopt dan gaan ze kletsen over de lesstof als je het goed organiseert dat wordt efficiënter dat is wetenschappelijk aangetoond kun je gewoon doen heb je ook minder computers nodig verboden vingers op te steken ook een heel bekend voorbeeld als je kinderen hun vinger op laat steken zijn het ongeveer twintig procent van de kinderen die steeds maar antwoord geven op jouw vraag tachtig procent doet dus niet mee als je kinderen verbiedt hun vinger op spope steken doet honderd procent mee want jij bepaalt wie antwoord moet geven dus kinderen kunnen zich niet meer verstoppen en kinderen die niet durven omdat ze niet zo assertief zijn krijgen ook een kans om atwoord te geven heel eenvoudig in principe de uitvoering is lastig want je hebt de neiging om wel kinderen die hun vinger opsteken de beurt te geven maar er ligt gewoon een kaartje op mijn bureau niet doenflippingde clase kun je ook uitbreiden je hoeft niet zelf filmpjes te maken mijn hoofdvak is biologie en bi biologie zijn er ontzettend veel filmpjes dus die ga ik niet maken ik ga ze gewoon opzoeken en dat geeft mij de mogelijkheid om zonder boek les te geven boek loze biologie hoe ziet dat eruit in de uitvoering ik zit ongeveer twee derde van mijn lessen in het computerlokaal kinderen krijgen de opdracht om iets op te zoeken en dat bij mij in te leveren in een eente tweetallen viertallen verschilt per opdracht en ze krijgen van mij ik doe dat thuis respons op die opdrachten wat gebeurt er zij kunnen niet leren voor de toets letterlijk niet en figuurlijk niet zij kunnen niet vlak voor de toets leren want ze hebben geen boek op het moment dat ze dat door hebben vragen ze maar hoe moeten we dan leren ze ja dat zit je de hele dag door te doen toch in mijn les in ieder geval en dan zal blijken dat je dus kunt leren tijdens de les best handig want je zit toch op school en dat leidt inderdaad tot reacties als meneer ik wist niet dat ik dit allemaal wist ik zei ik wist het ook niet maar ik hoopte het wel ik doe dit nu drie jaar en het werk heel erg goed testen niet toetsen wil zeggen ik hou niet van toetsen nakijken dus ik probeer dat te vermijden ik heb wel gelezen dat het heel handig is om te toetsen want daar leren kinderen van dus ik heb daarvan gemaakt testen want ik heb ook gelezen als u kinderen vaker test sneller nadat ze nieuwe stof hebben opgenomen dan gaan zij die stof beter onthouden en ze worden ook getraind in het terughalen van die stof dus het reproduceren van aanwezige kennis zorgt dat ze dat beter kunnen en zorgt ook dat die kennis beter behouden blijft nou als je dat digitaal doet heel weinig werkik heb twee mottos doen wat je wilt en weten wat werk doen wat je wilt wil zeggen als je een idee hebt en je zou dat willen doen moet je het gewoon doen en dat betekent dat je dan iets gaat doen wat jij zelf heel graag wilt waar je zelf heel erg goed in bent en daarom worden jouw lessen automatisch beter want jij hebt er lol in mijn leerlingen hebben pech of geluk dat mijn favoriet onderwerp denfievolutie net verteld daar krijgen zij dus heel veel van krijgen ze dan te weinig van het andere nee ik zorg er natuurlijk voor dat ze van al die andere onderwerpen voldoende krijgen om het examen te halen maar ze krijgen heel veel van toevallig het onderwerp wat ik leuk vind voor iedere docent is dat anders is dat erg dat niet alle kinderen precies hetzelfde leren nee vind ik niet weten wat werkt vind ik wel belangrijk als je kennis hebt opgedaan hoe iets werkt kun je dat gebruiken en ik vind het een verplichting voor mijzelf en voor alle docenten om te zorgen dat zij weten wat werkt ik zie heel veel mensen die eigenlijk na een x aantal jaren en ik is soms één niets meer bijleren die geven gewoon les die hebben de standaard les uitleg kinderen luisteren of niet opdrachten maken nakijken en er is het idee er is geleerd er is gewerkt door de docent en door de leerlingen nou ik betwijfel dat ten zeerste als dat echt zo zou zijn zouden niet zoveel leerlingen elke les vlak voor een toetsweek hebben volgende week toets aan mij vragen wanneer mag ik leren voor dat en dat vak want en daar staat in kleine lettertjes niet doen is ook doen dat zou eigenlijk de grote lettertje moeten zijn ik vind dat je iets moet doen en niet doen is ook een keuze en dat is denk ik de verkeerde keuze de zit erin om even een overgang te maken naar de leerlingen want het ging tot dusver vooral over wat ik vind probleem met communicatie is dat er vooral geluisterd wordt om een antwoord te geven niet om te begrijpen dus wij zitten als we luisteren vooral te denken wat voor antwoord ga ik geven en niet zozeer wat zegt die persoon nou eigenlijk de leerling de leerling staat centraal dat zie hier duidelijkmar staat die ook centraal er is binnenkort een bijeenkomst die heet stemmen van de leerling georganiseerd door het nivos in rotterdm een hele goede organisatie die heel veel goeds voor onderwijs en leerlingen doet en in de beschrijving van die bjeenkomststaat centraal staat de vragen waarom en hoe kan de stem van de leerlingen vergroot gehoord en gewaarborgd blijven na u raadt het al er zijn geen leerlingen aanwezig ik snap dus niet hoe je dat kunt doen zonder leerlingen is dit dus wat wij willen dit is niet wat ik wildat is wel misschien lichtelijk overdreven wat er vaak gebeurt ik vind dus dat je moet luisteren naar leerlingen dat is nog helemaal niet zo makkelijk honden kunnen dat heel erg goed maar geluid opvangen is iets anders dan luisteren en ik zal dat proberen te illustreren door te kijken naar hoe leerlingen luisteren dus proberen te luisteren naar uw leerlingen luisteren wat is het verschil tussen die twee nummer die eerste is twintigduizend keer bekeken die andere vijftig miljoen keer de eerste is hoe in mijn beleving leerlingen ons docenten vaak horen die tweede is hoe wij misschien zouden moeten praten en die dreun ja ik weet niet hoe die drin krijgen ik zou twee dingen vertellen over wat ik dan echt doe met leerlingen waar zij bij betrokken zijn de eerste is geniusouder dat is komt bij google vandaan twintig procent van de tijd konden goalwerknemers besteden aan wat zij maar wilden en nog in de week dat is door angela meyers vooral de amerikaanse docenten overgenomen die heeft die slogan daaronder gezet iedereen is een genie ergens in en de wereld kan iedereen zijn bijdrage gebruiken dan moet je wel ontdekken wat jouw genie is waar dat zit en hoe je dat kunt gebruiken nou das niet zo moeilijk ik geef mensen natuur in klasse twee dat is een virus vak één uur in de week mogen leerlingen doen wat ze willen daar is geen handleiding voor een paar richtlijnen die richtlijnen moet een beetje binnen het vak passen er moet iets geleerd worden bij voorkeur wordt er iets gemaakt hoeft niet bij voorkeur in een groepje hoef niet ze mogen zelf kiezen welk van de vier uur ze gebruiken ze mogen meer gebruiken ze mogen minder gebruiken afhankelijk van wat zij willen er moet iets gepresenteerd worden voor hem helemaal vrij als de andere leerlingen maar iets leren dit zijn quotes die ik heb gehoord zal ik verder niet toelichten zijn wat fotos van de leerlingen die de presentaties doen en ik wil me alleen op het meisje in het midden richten lucie lucie die ik wist niet wat zij aan het doen was iets met robots iets met programmeren en ik zeg maar ik zie jou niks doen ja ik doe het meest thuis na de presentatie kwam ik dacht ik ben benieuwd lucie begon haar presentatie die was naar de tudelftgeweest had een video gemaakt met een interview met een professor daar zijn naam weet ik niet meer helaas die haar een hal uur lang heeft laten zien de meest moderne robot die ze daar hebben hoe die zelf kan leren dat na en mooie presentatie illusie toen ging lucie verder zij had ook een robot gebouwd legermenstorms had ze daarvoor nooit gedaan had ze zichzelf geleerd ze ging aan de leerlingen laten zien in de klas zo moet je programmeren en dan gaat dit gebeuren er zaten drie verschillende sensoren op die robot die demonstreerden ze allemaal die les liep een kwartier uit geen leerling zei mijnheer het is tijd dat maak je niet vaak mee al deze leerlingen hebben iets gedaan wat ze zonder die optie om zelf te kiezen nooit gedaan hadden want het zit niet in het curriculum of in het programma van mensen natuur zij krijgen één uur de tijd daarvoor en hoe kan ik die een uur daaraan besteden wat ze normaal moeten doen in vier uur doen ze nu gewonen drie uur want ze willen dit heel graag doenals laatste wil ik noemen dat is zeer recent vorig jaar aan het eind an het jaar mocht ik één dag moest ik één dag vullen met mijn leerlingen ik heb ze gevraagd hoe zouden jullie willen leren nou dat komt van alles mooi uit daar zou ik een uur of twee urofdrieuur over kunnen vertellen één ding wat heel mooi was was het education desin lap wat leerlingen hebben opgericht en dat was gebaseerd op één zinnetje wij willen het leerrendement van de lessen verhogen kinderen uit drie vwo zeggen dat zij het leerrendement willen verhogen de minister die als die dat zou horen zij hebben een brief geschreven aan de schoolleiding hoe zij dat willen doen ik heb hier een blog over geschreven de schoolleiding is nog bezig met beslissen hoe wij dit moeten organiseren maar er zijn al drie kranten die deze kinderen willen interviewen gewoon om het idee wat ik van die leerlingen heb geleerd je moet niet denken in onmogelijkheden want in onmogelijkheden zitten ook mogelijheden heeft u nog vragen ja die heeft u volgende gaat het wel eens mis ja ik verzin van alles nieuws elk jaar minstens één ding het gaat wel eens mis steeds minder vaak maar dat is iet erg want het wordt langzamerhand wel beter moet je eigenwijs voor zijn ja eigen wil zeggen je hebt je eigen mening die moet je zoveel moi handhaven wijs moet je zijn je moet kennis hebben een eigen wijs is een ideale combinatie om te zorgen dat je dat ook gaat doen laat je niet weerhouden door je omgeving als jij ervan overtuigd bent dat het goed is moet je het gewoon gaan doen kan het met alles ja jenis oude kan met elk vak flip de klas kan met elk vak vingers opsteken al die dingen die ik heb genoed kan met elk vak beetje creatieve tijd nodig of ik nog tips heb ja gewoon doen klinkt heel eenvoudig maar het is best lastig heb ik gemerkt maar gewoon doen nou nou had ik gezegd dat de leerling belangrijk is dus bij mij staat de leerling echt wel centraal in deze cirkel het gaat namelijk over de toekomst van onze leerlingen ook onze toekomst dus die vind ik heel erg belangrijk en daar wil ik graag een bijdrage aan leveren ik wil u bedanken voor het luisteren en ik hoop dat op zijn minst één iemand van jullie maar het liefst allemaal natuurlik langer dan vandaag dus ook morgen en overmorgen iets hiervan meeneemt waardoor zijn lessen ietsje beter ordenen bovenaan staat mijn volgende presentatie en ook mijn volgende les zal weer ietsje beter worden dan we
|
log_speech-recognition-community-v2_dev_data_nl_validation_targets.txt
ADDED
@@ -0,0 +1,16 @@
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
1 |
+
0
|
2 |
+
lieve mensen wie houdt er van muziek klassieke muziek moet haast wel in amstelveen popmuziek of zijn er ook jonge hiphoppers in de zaal dacht ik al iedereen heeft wel iets met muziek maar is muziek ook heilzaam want stel je nou toch eens voor je bent drie jaar en je hebt een goed iq en je begrijpt alles maar je kunt geen oogcontact maken en je kunt ook niet terugpraten of hoe zou het zijn je bent vandaag dement of verstandelijk beperkt en je weet niet wie de persoon is die binnenkomt hoe laat het is of waar je bent of hoe zou je je voelen als jij morgen een hersenbloeding krijgt en je moet gaan revalideren en je kan alles weer tuinieren koken autorijden je begrijpt wel wat iedereen zegt maar je bent niet in staat om één stom woord te spreken wat brengt muziek je dan hoe heilzaam zou muziek kunnen zijn daar wil ik het met jullie over hebben aan het eind van mijn betoog hoop ik dat je zelf toepassingen ziet voor mensen met een beperking om hun kwaliteit van leven te veranderen maar eerst iets over het ontstaan van muziek heel lang geleden dan heb ik het over 50 duizend jaar geleden konden we al trommelen op fluitjes blazen maar we konden geen woord spreken en sinds die tijd heeft muziek een belangrijk onderdeel gespeeld in onze culturen in onze rituelen en nu heden ten dage in onze westerse maatschappij waar is de muziek in onze rituelen ja we hebben muziekles op school we luisteren naar muziek dat is incidenteel maar geen ritueel oké op onze huwelijksdag hebben we de vogeltjesdans dat is ons ritueel of bij onze begrafenissen de top drie andrea bocceli eric clapton en lieve mensen wereldwijd de nummer één is ave maria nog steeds niet mieke telkamp want dat is niet wereldwijd is dat dan alles zijn wij niet meer muzikaal wie van u vindt zich muzikaal wie van jullie speelt een instrument niet zo veel he maar toch blijkt dat 96 van jullie muzikaal is en dat is al wetenschappelijk aangetoond bij baby's van twee dagen oud laten we maar eens even testen dit is zacht en dit is hard klap maar mee allemaal zijn we muzikaal we scoren meer dan 96 lieve mensen al heel lang luisteren wij naar musici ik noem dit muziekbeleving muziektherapie gaat een stapje verder daarmee bedoel ik dat een professional via een interventie met muziek kwetsbare mensen met een beperking of een trauma hun kwaliteit van leven probeert te verhogen er is steeds meer wetenschappelijk onderzoek en steeds meer bewijs ook al is het nog flinterdun ik heb de eer om samen met de nederlandse wetenschappelijke top erik scherder dick swaab en henkjan honing om aan breed publiek de wonderen van muziek te tonen het allerbelangrijkste resultaat van het wetenschappelijke onderzoek is dat in tegenstelling tot onze spraak gehoor gevoel emotie dat zit allemaal op één bepaalde plek in onze hersenen terwijl muziek dat zit in heel veel gebieden van onze hersenen ik kom daar dadelijk nog op terug met een voorbeeld maar hoe is nu het effect op ons eigen leven onze kwaliteit van leven en laat ik mezelf als voorbeeld nemen als kind zijnde schreef ik verschrikkelijk slecht drama's altijd werden mijn ouders op school geroepen als ik weer een onvoldoende had ze waren het zo zat dat ze mij hebben laten testen een hersenfilmpje uit die test kwam naar voren dat ik een aangeboren trilling in mijn rechterhand had was dat even makkelijk ik hoefde nooit meer mijn best te doen als therapie kreeg ik pianoles daardoor heb ik niet alleen een rijk sociaal leven gekregen ik heb in heel veel bandjes gespeeld ik heb zelfs mijn vrouw erdoor ontmoet maar wat ook naar voren kwam in die test is dat ik een ongelofelijk concentratieprobleem heb dat heb ik weten om te buigen in een kracht ik durf van mezelf te stellen dat ik erg creatief ben goed kan verbinden maar ik ben zo waardeloos in details en prikkels ik wordt hier echt helemaal gek van het is maar goed dat het donker is want het gaat alsmaar malen anyhow een beroepsmuzikant zal ik niet worden altijd maar oefenen de hele dag door een heel ander voorbeeld mijn oudste zoon hier ook in de zaal op de middelbare school was hij zo ontzettend slecht in wiskunde maar goddank was er een oplettende wiskundeleraar die wist dat hij piano speelde die zei joh die wiskundetoets die er aan komt dat wordt helemaal niets voor jou in plaats van die toets ga je maar een stuk muziek componeren want dat is ook logisch nadenken ik laat jullie nu een fragment horen wat hij toen als opstandige puber heeft gecomponeerd nu maakt hij alle muziek voor mijn films en hij heeft ook zijn werk ervan gemaakt hij speelt acht instrumenten en muziek is zijn leven en zijn werk we gaan nu een stapje verder hoe is het nu voor mensen met een beperking door mijn jongste zoon ben ik gaan filmen ik ga jullie nu wat filmfragmenten laten zien hij zou het veel beter doen om aan te kunnen tonen wat muziek kan doen als je een beperking hebt maar eerst even wat cijfers 20 van ons is mantelzorger een zelfde percentage heeft direct of indirect te maken met dementie een vorm daarvan of parkinson en het dubbele lieve mensen psychisch lijden in welke vorm dan ook 40 van ons en ach slechts 3 ptss trauma's hier op deze foto zien jullie syrische kinderen die gevlucht zijn en nu hier wonen en eenzaamheid ouderen in onze vergrijzende maatschappij maar ook jongeren en als laatste voorbeeld het lijkt weinig slechts 1 van jullie heeft een vorm van autisme maar in nederland hebben we het dan wel over zo'n 170000 mensen wie van jullie heeft met deze groep mensen te maken zou muziek deze mensen kunnen helpen we gaan naar wat voorbeelden kijken die ik heb gefilmd we zien als eerste dimo een autistisch jongetje uit amstelveen van drie jaar oud jullie zien het in het begin geen oogcontact geen spraak naarmate de muziektherapie vordert komt dat op gang een heel ander voorbeeld jacqueline een zwaar verstandelijk beperkte vrouw wat jullie hier zien is dat jacqueline contact maakt door haar hoofd op de instrumenten te leggen want ze wilt die trillingen voelen en je zal hier denken ach 30 minuten muziektherapie wat een flauwekul maar bij mensen als jacqueline met enorme onrust en ook mensen met dementie kan het naeffect hiervan rust kan wel twee dagen aanhouden dertig minuten wie wil er nog een voorbeeld ja nee ik wel anders had ik het toch gedaan mevrouw donkers na een hersenbloeding spraaktherapeut kort en kort en lang muziektherapeute dan zegt u goede middag goede middag mevrouw donkers goede middag dit is het klassieke voorbeeld van iemand met een afasie je kunt niet spreken na een hersenbloeding deze mevrouw kon alles weer er zijn voorbeelden bekend dat mensen zes maanden lang niet kunnen spreken en na de eerste muziektherapiesessie in het begin zei ik al ik kom nog met een voorbeeld die muziek grijpt in op meerdere delen van de hersenen en daardoor kan het naar het spraakcentrum gaan zo kan deze mevrouw zingend leren spreken dat is toch ongelofelijk wat kunnen jullie nou zelf thuis doen ik geef u twee voorbeelden we kennen allemaal de parkinsonpatiënt die kan als een dronken man en nu moet ik die stip over als een dronken man lopen maar hoe simpel is het als je er vingerknippend naast gaat lopen je zal zien dat de parkinsonpatiënt in dat ritme mee kan lopen hoe bevrijdend moet dat voor hem zijn een tweede heel ander voorbeeld wat ik al eerder noemde mensen met een vorm van dementie met veel onrust vooral tijdens een wasbeurt dat is natuurlijk een drama maar hoe gemakkelijk is het om samen een liedje te zingen van vroeger de onrust gaat weg er is plezier en de wasbeurt is nog sneller klaar dan zitten wij maar te lullen in de zorg over geen tijd en geen geld is dit effectief of niet eerder klaar 50 van ons blijkt baat te hebben met de inzet van muziek ik heb het genoemd de voorbeelden dementie 20 we zijn mantelzorgers 20 psychisch leiden 40 dus ik zou jullie willen uitnodigen om thuis aan de gang te gaan inderdaad niet lullen maar doen lang leve de muziek
|
3 |
+
1
|
4 |
+
goedemiddag mijn naam is at kasbergen er was mij een hele mooie microfoon beloofd zodat ik dansend over het podium kon maar goed ik heb nu deze eventjes vast ik ga jullie meenemen in het verhaaltje van mijn school klein schooltje 50 leerlingen speciaal onderwijs en daar zijn kinderen die je kan ze psychiatrisch patiëntjes noemen je kan ze zeer moeilijk opvoedbaar noemen het zijn in ieder geval kinderen met een rafelrandje en de kinderen met dat rafelrandje zijn bekeken door de inspectie en wij zijn ook bekeken door de inspectie en gelukkig zijn wij een zeer zwakke school gelukkig zal ik uitleggen waarom wij dat zo noemen wij vinden het werk wat wij doen heel ingewikkeld en het zou zo raar zijn als iemand één dag bij je langs komt die komt kijken die komt in je papieren kijken en die kijkt eventjes slinks naar de kinderen en zegt nou dat doe je allemaal prima uitstekend goed bedacht terwijl we het zelf zo vreselijk moeilijk al vinden dat werk wat we aan het doen zijn je zou eigenlijk veel langer moeten kijken om een goed oordeel te kunnen vellen een voorbeeld om jullie een beetje mee te nemen in een dagje vanochtend had ik twee klassen ik had één zieke collega twee klassen bij elkaar dan zijn het nog maar 20 leerlingen hoor dus het is altijd nog minder dan wat in de basisschool in één klas zit ze zijn lief aan het lezen ik heb de wind eronder ze luisteren goed naar me meestal één heeft zijn boek niet open en ik vraag aan hem joh waar is je leesboek het antwoord is in je hol at en dan denk ik dat moet je even meenemen je staat voor 20 leerlingen en dan zegt er één en de rest hoort dat en ziet dat waar is je leesboek in je hol at en als je dat dan proeft ik vond het vreselijk leuk ik vind het heel grappig hoe dat klinkt en als hij het zegt klinkt het nog veel beter dan dat ik het zeg maar wat moet je dan en dat is een probleem wat je dan moet oplossen met dat kind want je wilt dat hij gaat lezen en wat bedoelt hij eigenlijk want hij staat net als de titel van mijn stukje hij staat bol van de spanning en hij bedoelt eigenlijk help me want straks moet ik misschien nog gaan voorlezen ook en dan horen de anderen de fouten die ik maak dus help me maar hij kan dat niet zo goed onder woorden brengen dus hij zegt 'in je hol at' dus mijn antwoord moet dan zijn ik moet niet boos worden ik moet leuk zijn tegen hem en ik kan alleen maar tegen hem zeggen joh dat is te donker daar brandt geen licht en als je dat dan gezegd hebt dan weet hij hij vindt 't niet erg dat ik dat gezegd heb de rest van de klas heeft zijn lol al gehad maar het is in soort gevleugelde term wel de hele dag door de school gegaan als ik vroeg 'waar heb je je brood' vul maar in in je hol at ja dat is leuk tenminste ik vind dat leuk mijn collega's vinden dat leuk de kinderen vinden dat charmant een inspecteur die komt kijken die vindt er eigenlijk helemaal niets aan die vindt dat niet leuk die waardeert dat ook niet wij daarna des te meer dus daarom zeggen we gelukkig een zeer zwakke school dat moet het niet blijven want dat kan consequenties hebben als het een zeer zwakke school blijft wordt op een gegeven moment de deur gesloten en vangen wij niet meer die kinderen op en wat voor kinderen zijn dat wat ik net beschreef met een rafelrandje en die kunnen dan eigenlijk niet meer op een andere school terecht want wat doen wij kinderen zitten thuis ze komen bij ons voor 4 maanden 5 maanden soms een jaar soms twee jaar wij doen er maar wat mee zoals ik net al beschreef het kan een beetje leuk zijn het kan een beetje grappig zijn maar ze willen wel naar school komen en ze blijven naar school komen maar die tijd bij ons die 34 maanden half jaar heel jaar twee jaar gaan ze weer naar school zitten ze dus niet meer thuis ik zal een voorbeeld geven niet hetzelfde kereltje wat ik net noemde maar er was een jongen die had een schoolfobie althans het werd ons verteld als een schoolfobie hij ging een jaar niet naar school de school waar hij eigenlijk op ingeschreven zat ving nog steeds het geld want die jongen is ingeschreven hij komt niet maar hij is wel ingeschreven bij ons dat werd te gek leerplicht zegt die jongen moet naar school die basisschool wilde hem niet meer hebben waar moet hij dan naar toe dan kom je bij ons terecht op een gegeven moment want wij zijn een beetje het laatste schooltje wat dan wat kan of wat wil deze jongen kwam met zijn ouders langs en dat was dus al heel wat en kwam dus vertellen hij was 12 jaar had een jaar thuis gezeten en had al wat acherstand opgelopen natuurlijk en zou de volgende dag bij mij in de klas komen ik heb tegen hem gezegd 'als je niet komt' ik heb hem uitgelegd hoe wij een beetje werken ik heb het heel gezellig gemaakt aantrekkelijk gemaakt voor hem als je niet komt kom ik je halen de volgende dag 9 uur wij beginnen kwart over 9 gaan we echt met de les beginnen 10 voor half 10 laten we nou maar met die les beginnen hij was er natuurlijk niet toen dacht ik van wat moet ik doen ik kan blijven wachten tot hij wel komt of dat zijn ouders hem brengen gebeld zijn moeder aan de telefoon hij wil niet toen moest ik mijn belofte waarmaken ik moest hem gaan halen het was niet zo ver van de school vandaan ergens in parkwijk en ik kwam bij het adres en toen dacht ik waar ben ik in hemelsnaam mee bezig ga ik iemand ophalen van huis om les te gaan geven die niet wil maar ik had het beloofd dus ik denk ik moet het toch blijven doen geen naambordje gordijn was dicht bij de keuken dus ik denk ik klop aan of er een hele kennel met bouviers was toen dacht ik ik kan nu nog steeds weggaan ging de deur open klein moedertje deed open aardige mevrouw kom maar binnen ik zeg ik kom hem ophalen dat heb ik beloofd en zij zegt ja hij is boven maar voordat ik ook maar naar een trap kon kijken had ik al een innige omarming met die bouvier voorpoten hier grote kop daar net doen of je niet bang bent niet naar die bouvier kijken het interesseert je niets je doet iets met psychiatrie dus je kijkt hem niet in de ogen en je doet of het normaal is dus ik zeg ik ga nu de trap op als u die hond in de gaten houdt dat wilde moeder wel doen dus ik ging de trap op en kwam eerst zijn broer tegen stond in een boxershort broer was ongeveer een jaar of 18/19 dikke gouden kettingen om en stond zijn kleren te strijken dus ik denk in wat voor wereld ben ik terecht gekomen omarming met een bouvier een strijkende jongen in een boxershort en ik zoeken naar een kind wat niet naar school wil kwam ik bij zijn deur deed zijn deur open en ja daar lag prinsheerlijk op een tweepersoonsbed jongen van 12 jaar flatscreen het is drie jaar geleden hè dus ik praat niet over nu nu heeft iedereen dat flatscreen behoorlijk formaat alle spelcomputers die je maar kan bedenken raampje open want het was lekker weer en hij lag daar ja waarom zou je nog naar school gaan dan doe je dat niet en dan komt er iemand binnen en die gaat zeggen we hebben een afspraak het enige wat ik kon zeggen was kan die bouvier misschien in die andere kamer dan ga ik naar beneden en ik verwacht dat je binnen 5 minuten aangekleed bent want we gaan naar school en tot mijn verbazing is dat gelukt aangekleed en naar school hij vond het wel gezellig maar dat komt het eerste moment is het weekend twee dagen vrij ga je dan nog ja na het eerste weekend ging hij nog naar school kwam je bij de herfstvakantie een week thuis hij werd een keer ziek komt hij daarna nog naar school ja hij is het hele jaar naar school geweest hij heeft dus inderdaad groep 8 op die manier bij ons gedaan op een zeer leuke manier en ging daarna naar het voortgezet onderwijs één keer heb ik hem nog uit zijn bed gehaald samen met iemand van die school daarna niet meer heb ik het niet meer gedaan want ik vond dat moet ik aan anderen laten doen drie jaar later ja dat klopt wat ik net verteld heb drie jaar later kwam ik hem tegen op omroep flevoland want ik herkende hem hoewel ze zijn gezicht een beetje onzichtbaar hadden gemaakt ik zag dat het hem was wat had hij nou gedaan hij had de auto van één of andere buurman had hij genomen en was hij tegen de pui gereden dus die had hij gestolen rondje gereden joyriden plezier zal hij zeker gehad hebben en hij eindigde in de voortuin vlak daarna kwam hij toch bij mij langs op school en ik vroeg aan hem het was zeker een automaat ja want anders had hij er niet in kunnen rijden en ik zeg en mijn auto staat daar en daar blijf je vanaf hij is daar vanaf gebleven maar ging helaas niet meer naar school en dat is nou het verhaal wat ik een beetje vertel deze kinderen hebben dus iets meer nodig dan het rekenen taal en lezen dat hebben ze ook allemaal nodig maar ze hebben iets meer nodig ze moeten toch denken van ik ben welkom op een bepaalde plek en welkom maken op een bepaalde plek dat is het allermoeilijkste is dat een kuchje van 7 minuten nee 8 en een half dat welkom voelen is belangrijk maar dat valt zo moeilijk uit te leggen aan inspectie en misschien is het al heel moeilijk om aan jullie uit te leggen maar ik kom nu wel bij het eind van mijn verhaal en dat is wij hebben vreselijk ons best gedaan de afgelopen periode om te denken van hoe moeten wij de inspectie dit verhaal nou laten zien nou dat kan ik ik kan misschien het dvd'tje opzetten daarna dan kan ik zeggen 'kijk hier' maar daar trapt ze niet in want ze wil de resultaten zien die wij van tevoren hebben opgeschreven dat kind gaat naar de havo gaat tl doen gaat bbl gaat kbl doen daar gaat het niet om inspectie daar gaat het echt niet om het gaat erom dat hij in ieder geval weer naar school gaat en naar school blijft gaan en dat moet lukken dat is een beetje onze opdracht en is mijn opdracht ook naar de inspectie om dat helder te maken het leuke is want dat komt nu donderdag 18 april staat zij weer voor de deur de inspectie en het zou zo grappig zijn en zo leuk zijn als mensen die hier nu zitten denken 'goh dat verhaal snap ik en dat moet zo blijven die school' de school heet de bongerd we zitten op boomgaardweg nummero 10 a vergeet die a niet en misschien kun je een briefje in de bus doen joh moet je langer zo doen of nee die inspectie die heeft pas gelijk dank jullie wel
|
5 |
+
2
|
6 |
+
als ik je vraag om naar mij te luisteren en jij begint mij adviezen te geven dan doe je niet wat wat ik vraag als ik je vraag om naar mij te luisteren en je begint mij te vertellen dat ik niet mag voelen wat ik voel dan neem je mijn gevoelens niet serieus als ik je vraag om naar mij te luisteren en jij denkt dat je iets moet doen om mijn problemen op te lossen dan laat je mij in de steek hoe vreemd dat ook mag lijken dus alsjeblieft luister naar mij en probeer me te begrijpen en als je ook wilt praten wacht dan even tot ik klaar ben en dan beloof ik dat ik op mijn beurt ook naar jou zal luisteren deze tekst zou zo door mij als kind gezegd kunnen zijn ik voelde mij als kind niet gehoord en niet begrepen ik ben net als die 70000 andere kinderen die jaarlijks te maken krijgen met de scheiding van hun ouders een kind van gescheiden ouders en ik heb last gehad van die scheiding ik ben ook een van die kinderen die sinds de scheiding het contact is verloren met een ouder ik weet nog dat ik dacht wie is er voor mij wie kan met mij meedenken wie kan mij helpen ik voelde me zo alleen ik was zo boos maar eigenlijk was ik vooral heel verdrietig ik was pas 12 en ik had geen idee wat ik met de situatie tussen mijn ouders aanmoest mijn droom is dat we een wereld creëren waar geen kind zich zo hoeft te voelen een wereld waar ieder kind zich gehoord en begrepen voelt het liefst zo vroeg mogelijk zodat we snel kunnen achterhalen wat er bij een kind leeft en het kind steun kunnen bieden mijn eigen ouders gingen uit elkaar toen ik een jaar of vier vijf was toen zijn ze officieel gescheiden ze zijn later weer bij elkaar gekomen voor de kinderen niet zo'n heel goed plan achteraf want de spanning was thuis uiteindelijk weer opnieuw voelbaar mijn ouders leefden langs elkaar heen er werd gezwegen aan tafel en mijn moeder sliep wel eens bij mij op de kamer vreemd om als kind mee te maken je voelt aan alles dat er iets niet klopt en wat deed ik ik dacht ik ga zorgen dat het thuis allemaal goed gaat ik gedroeg mij voorbeeldig deed mijn schoolwerk hielp met opruimen thuis als maar niemand last van mij had toen mijn ouders mij en mijn broer uiteindelijk vertelden toen ik elf jaar oud was dat zij opnieuw uit elkaar gingen kwam dat eigenlijk niet als een verrassing want ik had de spanning gevoeld ik was enorm verdrietig maar naast dat verdriet voelde ik ook ergens opluchting ik dacht hé hé zou het dan eindelijk klaar zijn met die spanning in huis zou het dan eindelijk weer rustig worden niets bleek helaas minder waar te zijn het werd alleen maar onrustiger er bleken onder andere rechtszaken tussen mijn ouders te lopen en daar kwam ik op mijn twaalfde achter omdat ik een brief van de rechter kreeg omdat ik ook iets mocht vinden van die scheiding ik weet nu als 36jarige vrouw dat mijn verhaal anders had kunnen lopen als er direct toen mijn ouders uit elkaar gingen iemand voor mij was geweest iemand die naast mij had gestaan naar mij had geluisterd maar ook iemand die mij uitleg had gegeven over wat er allemaal bij een scheiding komt kijken en die verstand had van hoe kinderen kunnen denken en die mijn stem en mijn gedachten en gevoelens in perspectief had kunnen plaatsen en had kunnen vertalen naar mijn ouders dan hoefde ik dat niet te doen om nog even terug te komen op mijn verhaal ik vertelde al dat ik een brief van de rechter kreeg en om jullie een stukje juridisch mee te geven ik ben immers jurist kinderen van 12 jaar of ouder krijgen een brief van de rechter waarin hun gevraagd wordt om iets te vinden van die scheiding over het gezag de hoofdverblijfplaats en de omgangsregeling/contactregeling moeilijke onderwerpen voor kinderen om daar je mening over te geven een kind mag komen hoeft niets te doen maar mag ook een brief schrijven vaak hun eerste post voor mij was dit mijn eerste post van een rechter nog wel ik durfde over deze situatie niet eens echt met mijn vriendinnen te praten over wat ik echt dacht en voelde en dan moest ik naar de rechter dat durfde ik niet langsgaan durfde ik absoluut niet maar ik had wel het idee dat die rechter iets van mij verwachtte in de zin van dat ik het moest oplossen tussen mijn ouders dus ik ben een boekwerk aan emoties gaan opschrijven en een brief gaan schrijven aan de rechter niemand hielp mij met die brief niemand vertelde mij wat mijn gedachten en gevoelens betekenden kijkend naar de situatie tussen mijn ouders maar ook kijkend naar mijn leeftijd ik was pas 12 en niemand vertelde mij wat voor impact mijn brief kon hebben in het juridisch speelveld en jarenlang heb ik gedacht dat mijn brief de oorzaak was van alles want mijn vader werd uiteindelijk uit de ouderlijke macht ontheven hij verdween uit eigen beweging steeds meer uit beeld was dat mijn schuld was dat door wat ik had opgeschreven ik had toch opgeschreven dat ik allebei mijn ouders heel graag wilde zien en dat ik bij hun allebei wilde wonen reageerde hij daarom niet meer op mijn belletjes of op mijn brieven waarom wilde hij mij niet meer zien wat had ik gedaan gedachten en gevoelens die mij als kind van 12 overspoelden en doorsijpelden in alles wat ik deed ik kreeg moeite met relaties aangaan want iemand aan wie je je verbind kan ook weer weggaan ik ging mij focussen op school ik ging minder eten en ik voelde mij ontzettend onzeker mijn verhaal is geen uniek verhaal het is een verhaal van heel veel kinderen van gescheiden ouders niet de volledige blauwdruk ervan want elk verhaal is uniek maar wel delen daarvan en nu als professional werkend met kinderen in een scheidingssituatie vertellen kinderen mij zo vaak hoe schuldig zij zich voelen en dat ze bang zijn om tegen hun ouders te zeggen wat ze denken en voelen of dat ze zich verantwoordelijk voelen en denken dat ze het moeten oplossen tussen hun ouders wat mij betreft luisteren wij nog veel te weinig echt naar kinderen daar bedoel ik mee dat we kinderen of helemaal geen stem geven we slaan ze over of dat we kinderen hun stem maar beperkt betrekken of dat we ze veel te verantwoordelijk maken dus als een kind zegt we gaan dit doen dan gaan we dat doen maar kinderen zijn niet degene die de beslissing nemen luisteren naar kinderen staat voor mij dat we hun stem betrekken maar dat we ook goed kijken wat in het belang van kinderen is en dat kan soms tegenstrijdig zijn en dat ze daar uitleg over krijgen terugblikkend op mijn eigen verhaal en vooral kijkend naar die kinderen die te maken hebben met die schuldgevoelens en dat loyaliteitsgevoel ben ik gaan nadenken of het niet anders kan kunnen wij niet op een kindvriendelijke manier de stem van kinderen betrekken daarom ben ik in 2015 onderzoek gaan doen naar het buitenland en naar nederland en heb ik de rol van de kindbehartiger ontwikkeld en om jullie mee te geven dat het ook anders kan wil ik jullie het verhaal van marnix delen marnix is een jongetje van 9 jaar en zijn ouders gaan uit elkaar ze zijn getrouwd geweest dus dan moeten ze langs een advocaat een van de advocaten was bekend met de rol van de kindbehartiger en vroeg de andere advocaat zou jij er voor open staan dat wij onze cliënten informeren over de kindbehartiger en toestemming vragen aan deze ouders dat zij marnix ook een belangenbehartiger bieden en beide ouders zijn akkoord gegaan zo waren de advocaten er voor de ouders en was de kindbehartiger er voor marnix er is bewust gekozen om meerdere gesprekken met marnix te voeren zodat hij goed zijn stem kon uitten goed met hem kon worden meegedacht maar hem ook echt uitleg kon worden gegeven en hij zich vertrouwd kon voelen bij de kindbehartiger want je moet je hele levensverhaal op tafel gooien daar is tijd voor nodig samen is uiteindelijk een verslag gemaakt waarin de stem van marnix terugkwam maar waar ook de kindbehartiger vanuit haar expertise een advies heeft neergelegd en dat verslag is naar de rechtbank gegaan de rechter nam dat verslag heel serieus want de ouders hadden allebei hun eigen visie en daar kwam de stem van marnix en het advies van een professional uiteindelijk is de visie van marnix gevolgd en is het advies opgevolgd samen is men na de zitting met de ouders van marnix om tafel gegaan en is gekeken hoe een gesprek met marnix kon plaatsvinden om hem uitleg te geven over wat er in de zitting had plaatsgevonden zodat hij nog zijn vragen kon stellen aan zijn ouders en zijn ouders hem konden uitleggen dat hij nooit tussen hen hoefde te kiezen en dat ze afspraken hadden gemaakt en rekening wilden houden met hoe hij zich voelde en met zijn mening ik weet nog marnix tijdens dat gesprek dat vrolijke koppie van dat 9jarige jongetje zo trots want hij had zijn stem geuit hij hoefde zich niet schuldig te voelen hij hoefde niet te kiezen tussen zijn ouders hij zei ik was zo zenuwachtig mijn hart maakte allemaal sprongetjes maar jeetje eigenlijk is die scheiding zo erg nog niet jullie zijn veel aardiger tegen elkaar en ik mag ook nog twee keer op vakantie er zitten ook voordelen aan en dat koppie van marnix ik dacht ja het kan anders als we naar kinderen luisteren kunnen we ook nog lering trekken uit hun verhaal want wat kinderen aangeven is 'luister naar mij leg mij dingen uit maar maak mij niet verantwoordelijk ook na de scheiding heb ik allebei mijn ouders nodig ik kan niet tussen mijn ouders kiezen ook al lijkt het dat ik dat soms wel doe bied mij steun door iemand die er speciaal voor mij is' dit horende lieve ouders stel dat jullie te maken hebben met een scheidingssituatie sta open tot jullie kind een stem bieden lieve familieleden en omstanders bied een luisterend oor maar blijf daarbij neutraal kies geen partij voor een ouder lieve school sta op voor die kinderen die de steun in de klas nodig hebben waar je ziet dat dit nodig is en vooral lieve kinderen weet dat er mensen zijn die echt naar jullie willen luisteren en dat jullie stem ertoe doet dank jullie wel
|
7 |
+
3
|
8 |
+
goeienavond kan de stad de wereld redden met een knipoog naar antwerpen 93 dat er tot nu over gediscussieerd heeft of kunst de wereld kan redden ik open het nieuwe debat maar op het einde van deze 20 minuten kent u het juiste antwoord de context de stad wordt in elk geval de wereld mijn werk situeert zich in een grondige overtuiging dat we in een transitiefase zitten in de wereld die vergelijkbaar is met de neolithische revolutie of de industriële revolutie met andere woorden een transitie waar we ingestapt zijn en waar we eigenlijk niet goed weten waar we uitkomen maar waarbij we toch ongeveer zeker zijn dat we een totaal andere soort samenleving een totaal andere soort menselijke verbanden zullen krijgen op het einde in het begin van de negentiende eeuw woonde tien procent van de wereldbevolking in steden in het begin van de éénentwintigste eeuw is dat al meer dan de helft van de wereldbevolking en in de meest ontwikkelde continenten is dat meer dan drie kwart tot vier vijfden van de bevolking die in steden woont en meer en meer zijn dat ook grote steden in 1950 waren alleen new york en londen steden van meer dan acht miljoen inwoners vandaag groeien de megapolen vooral in de derde wereld aan een geweldige snelheid vandaag hebben we 411 steden van één miljoen inwoners de grootstad groepeert die urbanisering de stad is ook sinds een paar jaren vijftien jaar ongeveer het nieuwe centrum van de economie in de periode 6070 die decennia was de gemiddelde rijkdomproductie in de steden over het algemeen lager dan het nationale gemiddelde de industriële samenleving speelde zich af buiten de steden de postindustriële samenleving die ontwikkelt zich in de steden vandaag hangt de economie af van de stedelijke sterkte we zien in europa zeker in het kerngebied van europa de groei van de steden maar tegelijkertijd ook in perifere gebieden een nieuw fenomeen van 'shrinking cities' steden die tot tot 2025 procent van hun bevolking verliezen en antwerpen is één van die steden die aan het groeien is dat is niet altijd zo geweest een stad is een levend organisme en in de hoogdagen 1585 voor de val van antwerpen 100000 inwoners in het begin van de negentiende eeuw 55000 inwoners en dat is dan weer pas langzaam omhoog gegaan tot eigenlijk in het begin van de twintigste eeuw 300000 de stedelijke ontwikkeling is vooral een fenomeen geweest van de 20eeeuwse industrialisering in deze stad en we zien opnieuw een daling na de tweede wereldoorlog vooral het einde daarvan 6070 de suburbanisatie die pas sinds '95 eigenlijk sinds deze eeuw omgekeerd is waarbij je opnieuw een stedelijke groei krijgt en waarbij je dus een verstedelijking krijgt van de voorstad en een lichte terugkeer van de stadsvlucht ik zeg 'lichte terugkeer' omdat eigenlijk de groei van de steden vandaag vooral samenhangt met één een verhoogde nataliteit vooral in de populaties van migrante oorsprong en ten tweede buitenlandse immigratie en we zien dus de steden opnieuw groeien in een stadsgewestelijk gebied ik laat hier een kaart zien van de verschillende stadsgewesten in belgië welnu in deze context moeten we ons de vraag stellen welk soort samenleving en welk soort ontwikkeling we dan tegemoet gaan weinig mensen beschouwen zich als stedeling dertig procent woont buiten de stedelijke gebieden veertig procent woont in de pendelzones gaan wel in de stad werken of winkelen of brengen hun kinderen daar naar school maar wonen zelf in het buitengebied twintig procent woont aan de rand van de stad tien procent woont in de stad zelf mag ik hier even de vraag stellen de hand op te steken van wie woont in de stad voilà antwerpen stedelijkheid als ik dat vraag aan mijn studenten in het eerste jaar dan heb ik 1015 procent van de studenten die hun vinger opsteken in de stad en de rest beschouwt zichzelf buiten de stad en dan laat ik zoiets zien en dan vraag ik aan de mensen waar dat buitenstedelijk gebied eigenlijk is waar ze dan wonen want dit is de verstedelijking dit is de bebouwde zone die je eigenlijk in het noorden van belgië kan zien dat vertegenwoordigt eigenlijk een suburbane mentaliteit ik laat u een citaat zien de stad is de grote bewerker geweest van de geestelijke en ruimtelijke ontworteling er bestaat geen stad van de mens de stad zal altijd de vijand van het menselijke zijn in 1984 geschreven door een vlaams politicus wonend in de schaduw van brussel en twee dagen geleden met de g8 vergaderend over de wereldproblemen dit is een reclame rond het autosalon ik vergroot het kleine stukje uit u rijdt in alle comfort en uiterst veilig op weg naar brussel of de jungle van een andere grootstad met andere woorden wij leven in een discours waarbij we denken dat het goede leven zich afspeelt buiten de stad met een ideaalbeeld eigenlijk van een eigen huisje eigen tuintje in het voorgebied en waarbij we dus eigenlijk een probleem stellen over het samenleven in de stad met andere woorden we zijn nog altijd overtuigd zoals in de negentiende eeuw zoals de sociologie van de negentiende eeuw en het begin van de twintigste eeuw ons eigenlijk geleerd heeft dat we eerst aan gemeenschapsvorming doen en dat wil zeggen dat we samen met mensen van ongeveer dezelfde taal dezelfde cultuur dezelfde eigenschappen samenwonen en dat we op basis daarvan van gemeenschappelijkheid een maatschappij opbouwen met andere woorden de socialisatie de menselijke samenleving wordt gedacht en ik denk in deze stad zoals op zovele plaatsen in vlaanderen wordt dat nog steeds gedacht dat is dat het socialiseren in de eerste plaats gebeurt in de nationale gemeenschap nochtans denk ik niet dat dat een stedelijke vorm van samenleven mogelijk maakt een stad is per definitie een verscheiden mensengemeenschap met verschillende gemeinschaften verschillende gemeenschappen en ik zal daarop terugkomen omdat ik denk dat dat één van de grote problemen is in de nationale gemeenschap denken we dat we samenleven op basis van een gedeeld verleden ik denk dat daar vanavond al over gesproken is welnu dat gedeeld verleden waarvan we weten dat het voor een belangrijk deel ook een geconstrueerd verhaal is dat bouwt de identiteit die in de tijd moet voortgezet worden en gerepresenteerd dat is ook de basis eigenlijk van de vertegenwoordigende democratie de representatieve democratie die het meningsverschil binnen die gelijkheid binnen die identiteit toelaat en uitdrukt maar tegelijkertijd ook de continuïteit moet garanderen en dat gebeurt binnen een territorium waarvan men denkt dat binnen de grenzen de homogeniteit de identiteit relatief groot is en dat het verschil met buiten de grenzen altijd groter is dan het verschil binnen de grenzen welnu op al deze belangrijke punten verschilt de stad en de stedelijkheid eigenlijk als we in de stad waar ik nu woon brussel moeten zorgen voor een gedeeld verleden als we eerst onze roots moeten vergelijken in een stad waar 56 van de mensen van buiten de stad komt en dat is in antwerpen ook steeds meer het geval welnu dan is dat een project dat op voorhand tot mislukken gedoemd is een stad steunt op lotsverbondenheid of we het nu willen of niet we zullen die stedelijkheid samen in de toekomst vorm moeten geven en dat betekent dat we een project moeten uitwerken dat we naar de toekomst gericht moeten werken en dat project heeft niet zo een sterke identiteit die doorheen de tijd langzaamaan is opgebouwd en tot een vast verhaal is vergroeid dat is een hybride verhaal een mengverhaal een verhaal zoals we vanavond al een paar keer op het podium hebben gezien dat geconstrueerd is op basis van het verschil en op basis van tegenstelling en dat betekent dus ook dat je dat niet kan opbouwen zonder aan de mensen te vragen deel te nemen een stad is bij uitstek coproductief het is daarom dat de participatieve democratie een stedelijk probleem is een stedelijk agendapunt is veel meer dan een nationaal een landelijk agendapunt waar vertegenwoordigende democratie nog altijd pretendeert het volk te kunnen vertegenwoordigen en die stedelijkheid speelt zich ook veel meer af in netwerken dan in territoria de ruimtelijkheid de organisatie van de stad en van het verband tussen mensen in die stad is van een andere soort dus moeten we dat verschil tussen landelijkheid nationaliteit en tussen stedelijkheid de stedelijke samenleving duidelijk voor ogen houden welnu de stedelijkheid lijkt mij de mentaliteit te zijn zie je wel de mentaliteit van de mondialisering die we met een geleerd woord 'glocalisering' noemen omdat de mondialisering plaatsgrijpt vanuit bepaalde plaatsen gebeurt 'glocaal' gebeurt de stad is dus de plaats een knooppunt voor politieke en sociale reconstructie en wanneer we dus wat een groot probleem is in deze wereld moeten zoeken naar registers naar niveaus waarop we de wereld die een beetje uit onze handen glipt opnieuw onder controle kunnen krijgen dan is dat ongetwijfeld aan de ene kant de grote schaal zeg maar de continentale de europese om niet te zeggen de wereldschaal maar aan de andere kant ook zeker de lokale schaal en dan spreek ik over metropolitane gebieden dan spreek ik over stedelijke gebieden wij moeten dus denken hoe we democratische modellen op dat niveau uitbouwen een tweede belangrijke conclusie is dat stedelijke cultuur een gemaakte cultuur is geen gegeven cultuur en dus dat we die cultuur voortdurend in een hernieuwde creativiteit vanuit het verschil vanuit de diversiteit moeten vormgeven en in die zin is inderdaad 'urban culture' van een andere soort dan de cultuur die we gewoonlijk produceren dus de creatieve stad en de stedelijke democratie zijn belangrijke agendapunten voor de wereld van de toekomst wij staan voor een belangrijke demografische uitdaging de bevolking groeit tegen 2020 antwerpen +100000 inwoners we weten hoe die bevolkingsgroei er zal uitzien het maakt de stedelijke bevolking jonger diverser en ook armer dat betekent dus een grote uitdaging voor de stedelijke organisatie dat betekent dus dat we nieuwe stedelijke economieën moeten ontwikkelen en dat we er niet moeten van uitgaan dat de bestaande economie die vooral voor hoogopgeleiden dient die vooral in de dienstensector en de zorgsector zich ontwikkelt dat die zal volstaan om al die nieuwkomers om al die mensen die van buiten komen op te nemen wij kunnen niet van al die mensen vragen dat ze eerst worden dat ze zich aanpassen aan de bestaande arbeidsmarkt met andere woorden er moet gezocht worden vanuit de talenten van de mensen vanuit de vaardigheden van de mensen om economische activiteit te ontwikkelen de vier belangrijke d's waarin die stedelijke ontwikkeling moet gedacht worden duurzame ontwikkeling betekent densiteit verdichting dat is in vlaanderen een zeer moeilijke zaak vlaanderen is laat geïndustrialiseerd en heeft een verspreide woonpolitiek gevoerd waarbij de mensen meestal niet gaan wonen waar ze werken liefst blijven wonen waar hun grootmoeder geboren is en dan elke morgen van hun woonplaats naar de werkplaats in de auto zitten meestal stilstaan en vandaag is dat een belangrijk probleem in de ontwikkeling de ruimtelijke spreiding is niet duurzaam de mobiliteit is geblokkeerd en we zullen dus naar verdichting moeten gaan en verdichting betekent ook leren omgaan met diversiteit niet alleen vanuit de rand naar de stad kijken als een gebruiksvoorwerp om te komen werken te komen winkelen of aan cultuur te komen doen maar als een samenlevingsmodel op basis van verschil en niet op basis van gelijkheid en dat betekent dus effectief dat we de democratische ontwikkeling zullen moeten herdenken daarin het burgerschap zullen moeten herdenken dat alles moet eigenlijk het onderwerp maken van een toekomstvisie voor de stad van een stadsproject en deel uitmaken van het maatschappelijk debat ik heb op de radio een paar dagen geleden ook gezegd dat ik denk dat zeker in de stadsgewesten van vlaanderen het goed zou zijn mochten de lokale verkiezingen van oktober inderdaad gaan over een stadsproject een stadsproject dat ofwel gedacht wordt op basis van diversiteit en op basis van samenhang creëren op basis van het verschil en dus een kosmopolitische visie van de stad ontwikkelt ofwel een visie op de stad waarbij het eigenlijk suburbane residentiële bewoners zijn die opleggen aan de stad hoe ze zich moet organiseren als een goed gebruiksvoorwerp ik denk dat dat spanningsveld heel sterk aanwezig is en dat het interessant is om daar een politiek debat te voeren en rond die verschillende projecten effectief een draagvlak te ontwikkelen concluderend een stad denk ik is geen land een stad is een hele wereld staat dichter bij de mondialisering staat dichter bij de reële complexiteit van de wereld en is dus een toegangspoort tot de wereld ik denk zoals ik in het begin heb gezegd dat de menselijke samenleving dat de menselijke soort een stadsdier aan het worden is we zijn daar niet voor opgeleid we hebben dat niet geleerd we hebben niet die mentaliteit we zullen nochtans die mentaliteit ons eigen moeten maken deze generatie of de volgende generatie want inderdaad de wereld zal er steeds meer gaan uitzien als een postnationaal knooppuntnetwerk van verschillende stedelijke gebieden waarin de activiteit zich zal afspelen waarin migratie en mobiliteit deel zullen zijn van het leven en waarin we dus permanent met aankomers met nieuwkomers zullen moeten samenleven en we moeten op die basis de menselijke samenleving herdenken in de stad is dat makkelijker omdat dat dichter bij de wereld staat dan dat dat in het land gebeurt dat eigenlijk naar het verleden is gericht dank u voor de aandacht
|
9 |
+
4
|
10 |
+
het is 3 maart 2014 na een onrustige nacht word ik wakker en net als iedere dag check ik direct mijn telefoon eerst kijk ik het nieuws ik kijk wat social media en uiteindelijk mijn mail dan loop ik naar de badkamer doe de deur open en loop naar binnen ik kijk in de spiegel en ik zie mijzelf niet staan 10 kilo zwaarder veel minder sociale contacten en een energielevel dat lager was dan ik ooit had gevoeld dat was wat mij gebeurde na een jaar werken in een corporate omgeving in al die 26 jaar daarvoor had ik me beter gevoeld ik thijs die energieke jongeman vol levenslust naast mijn studie werkte ik er ook zo'n 25 tot 30 uur in de week bij maar nooit had ik het gevoel dat dit mij enigszins belemmerde in het mooie leven je had zelf de keuzes een aantal colleges in de week werd aangeboden en daarnaast moest je maar kijken hoe je het indeelde uiteindelijk moest je je tentamens en je papiertje halen het doel was bekend en daaromheen had je de ruimte en vrijheid om zelf keuzes te maken ging je wel naar die borrel of niet nam je wel dat ene bijbaantje of niet volg je wel dat ene college of doe je dat niet allemaal keuzes maar de vrijheid en ruimte om deze keuzes te maken die had je zelf tot dat moment ik tekende mijn eerste contract en weet je na zeven jaar studeren en een wereldreis verder was ik er wel klaar voor ik had er zin in een maatschappelijke carrière tot die ene maandagochtend op 3 maart 2014 de spiegel die mij vertelde tijs dit ben jij niet dezelfde spiegel die mij vertelde dat ik jarenlang had geloofd in iets wat mij altijd verteld was haal je studie vind een baan en het leven lacht je toe dezelfde spiegel die mij vertelde dat ik in iets geloofd had wat helemaal geen realiteit was dezelfde spiegel die mij vertelde dat deze manier van werken me zoveel meer energie kostte dan dat het me opleverde en als ik ooit gezond en vitaal oud zou willen worden dat ik dit in ieder geval niet moest doen ik ben die spiegel tot op de dag van vandaag nog steeds dankbaar dat hij me dat op dat moment heeft verteld want het aantal burnoutgevallen in nederland rijst de pan uit en is inmiddels beroepsziekte nummer één we hebben nog nooit zoveel chronische ziekten gehad als op dit moment ruim 15 miljoen mensen in nederland zijn eenzaam die hebben nauwelijks tot geen sociale contacten en meer dan 13 miljoen mensen slikken dagelijks antidepressiva en dan te bedenken dat we 130 jaar oud gaan worden 130 jaar oud 50 van de kinderen die op dit moment geboren wordt wordt in ieder geval ouder dan 100 50 wat ik geleerd heb terugkijkend in die spiegel er zijn drie belangrijke elementen in het leven tijd energie en middelen als je op school zit of studeert heb je vaak veel tijd en energie maar het ontbreekt je aan de middelen als je dan gaat werken heb je vaak wel middelen en ook wel energie maar het ontbreekt je vaak aan tijd en ook steeds meer aan energie als we met pensioen zijn hebben we zeeën van tijd en vaak ook wel wat middelen maar ontbreekt het ons aan energie als je gezond en vitaal oud wilt worden dan wil je toch je hele leven lang beschikken over tijd energie en middelen we hebben een wereld gecreëerd waarin 40 uur in de week declarabel zijn de standaard is en je moet ze ook nog maken tussen maandagochtend half negen en vrijdagmiddag vijf uur we hebben een wereld gecreëerd waarin 'druk zijn' ons status geeft als je niet druk bent dan vraagt iedereen zich af wat ben je dan aan het doen zou je er niet iets bij moeten doen we hebben een wereld gecreëerd waarin iedere dag files files files het leven beheersen we willen allemaal op dezelfde tijd op dezelfde plek zijn iedere dag weer we hebben het alleen maar over meer meer en beter beter in plaats van over duurzaam uiteindelijk denken we nog steeds dat we van negen tot vijf werken maar eigenlijk werken we van zeven tot zeven want vanaf het moment dat je 's ochtends opstaat rent naar de douche rent naar de ontbijttafel rent naar het kinderdagverblijf in de hoop niet aan te sluiten in de file en in de hoop om dan om negen uur aanwezig te zijn om hetzelfde kunstje dan om half zes weer te herhalen dit is niet van negen tot vijf dit is van zeven tot zeven iedere dag weer en als je dan ook nog zeven of acht uur slaapt blijft er weinig van de dag over en dan te bedenken dat we eigenlijk weten dat 80 van de mensen tegen zijn interne klok in werkt dat we op een werkdag van acht of negen uur op kantoor eigenlijk maar drie tot vier uur echt productief zijn en dat we weten dat negen uur per dag achter de computer zitten op een kantoor ongeveer het slechtste is dat je je lichaam aan kunt doen en toch houden we hier aan vast omdat het zo hoort omdat het hier nou eenmaal zo gaat we hebben een werkwereld gecreëerd die ver weg staat van onze innerlijke behoefte en waar niet de mens maar de medewerker centraal staat en de grap is we hebben eigenlijk de oplossing al in handen het ligt al dichtbij denk bijvoorbeeld aan de techniek ik herinner me nog als de dag van gisteren dat ik voor het eerst een mail binnenkreeg op mijn mobiele telefoon ik dacht dat is handig dat scheelt me een hoop tijd en energie om mijn laptop open te klappen de techniek moeten we omarmen de techniek zorgt ervoor dat we 24/7 kunnen werken en dat we niet fysiek aanwezig hoeven te zijn om een taak te volbrengen de techniek omarmen en voor je laten werken door mensen hier juist in te trainen creëren we veel meer ruimte en vrijheid we gaan nu regels opleggen wanneer we wel en niet mogen mailen maar ik kan u een ding vertellen die techniek wordt alleen maar meer laten we alsjeblieft de techniek voor ons laten werken we houden vast aan een systeem van 50 of 60 jaar geleden terwijl we totaal andere middelen tot onze beschikking hebben we hebben het constant over worklife balance maar eigenlijk is het toch gewoon het leven werk en prive is gewoon het leven heel veel bedrijven roepen heel hard het nieuwe werken maar ondertussen blijven we wel vasthouden aan aanwezigheid en controle best wel gek vindt u niet we worden geleefd vanuit werk en niet vanuit vitaliteit en gezondheid het is toch ook niet gek dat je soms even geen zin hebt het is toch niet gek dat er soms niets uit je handen komt het is toch niet gek dat als je een nacht slecht geslapen hebt dat het dan even niet lukt het is allemaal menselijk als we de menselijke maat wat meer voorop stellen ervaren we veel meer ruimte en vrijheid en creëer je daarmee een veel hogere kwaliteit van leven en dat komt een duurzaam bedrijfsresultaat altijd ten goede middag dutjes ja altijd doen het bevordert je creativiteit enorm en het is beter voor je gezondheid overdag sporten of bewegen ja doen het bevordert je productiviteit enorm de doorbloeding in de frontale kwab van je hersenen zorgt ervoor dat je een veel beter probleemoplossend vermogen hebt dat je veel initiatiefrijker bent en veel gemotiveerder bent andere dingen doen een keer tussendoor op een werkdag boodschappen winkelen lunchen met je vader moeder opa oma allemaal doen deze vorm van vrijheid en ruimte geeft je zoveel meer productiviteit op de momenten dat je wel aan het werk bent daar wordt iedereen beter van en het scheelt je ook lange rijen bij pashokjes op zaterdagmiddag de kassa de sportschool om zeven uur waar geen toestel meer te krijgen is het heeft eigenlijk alleen maar voordelen maar we hebben een wereld gecreëerd waarin het belangrijkste in ons leven tijd voor je gezin je omgeving en sociale contacten onder druk zijn komen te staan een wereld waar mensen de laatste dagen van hun vakantie beginnen af te tellen omdat het zware normale leven weer gaat beginnen en waar een grote groep mensen zich op zondagavond zo slecht voelt omdat ze op maandagochtend weer moeten gaan werken en een wereld waar 'druk' en 'geen tijd' ongeveer de meest gehoorde stopwoordjes op een gemiddeld kantoor zijn dit is niet nodig door tijd energie en middelen anders te verdelen autonomie te stimuleren en mensen hierin te trainen ervaren we veel meer ruimte en vrijheid en verhogen hiermee de kwaliteit van leven van iedereen alleen wij kunnen gezamenlijk een wereld creëren met minder burnouts minder chronische ziektes minder eenzaamheid en minder antidepressiva een week heeft 168 uur als je er daarvan ongeveer 50 slaapt en ongeveer 40 werkt betekent dat er nog 78 over zijn dat is bijna drie en een halve dag als je morgenochtend wakker wordt en ook in de spiegel staat te kijken vraag jezelf dan eens af wat heb ik nou nodig voor een hogere kwaliteit van leven en bespreek dat met je werkgever met je collega's want samen vinden jullie een weg die het echt voor iedereen beter maakt want zeg nou zelf welke werkgever wil er nou geen positieve energieke en warme collega's mij bevalt het als werkgever fantastisch en ik zou nooit meer anders willen wie van u zit hier nu en denkt 'leuk verhaal maar onhaalbaar' ik kan heel slecht zien maar toch weinig hier eentje dat is toch leuk vijf jaar geleden hebben we op deze plek een bedrijf gecreëerd met massagestoelen met sportfaciliteiten met een vierdaagse werkweek met onbeperkt vakantiedagen en dames en heren ook wij groeien al vijf jaar op rij en we zijn niet het enige voorbeeld er zijn er echt meer echt waar als je nou morgen wakker wordt en je praat hierover met je collega's en andere mensen dan gaan jullie het voor iedereen net een klein beetje beter maken dank je wel
|
11 |
+
5
|
12 |
+
1980 ik was 10 11 jaar en één ding wat ik het liefste deed samen met mijn broer was strips lezen we hadden hele stapels thuis en mijn lievelingsstrip was lucky luke lucky luke met zijn witte hoed de grote redder strijder tegen het kwade en die had altijd oplossingen dat was een fantastische vent en tegen wie streed hij wat was zijn grootste tegenstander de daltons altijd een grijze of een donkere hoed maar in ieder geval het was altijd duidelijk en het was eigenlijk hetzelfde als je vroeger de oude westerns op tv zag die zwartwit series dan had je bonanza en rawhide en dan had je altijd de slechteriken met een zwarte hoed en de goeieriken met de witte hoed dat maakt het eigenlijk heel makkelijk goed en slecht je wist van tevoren precies waar je aan toe was en aan het eind van het verhaal zag je hen altijd tegen de zonsondergang in rijden op zoek naar een volgende avontuur en die kerels zagen er nog goed uit ook ik ben rob rob verhagen ik ben een trotse vader een partner een levensmiddelentechnoloog en ik werk bij de grootste chocoladefabriek van de wereld en daar ben ik best trots op maar ik heb een probleem wij hebben een probleem jullie hebben een probleem we zijn te dik wie heeft er een paar kilootjes te veel ja ik zie wat voorzichtige vingertjes ik zal de vraag anders stellen wie denkt er dat zijn partner een paar kilootjes te veel heeft nou dan krijgen we hem al een beetje in de gaten en dat is een probleem hè en dan praten we over kilo's te veel we praten over overgewicht maar als je te veel overgewicht hebt heb je last van obesitas zwaarlijvigheid en obesitas zwaarlijvigheid we zien het vaak als een cosmetisch probleem maar er is geen probleem wat dat betreft het verhoogt je risico op hart en vaatziekten het verhoogt je risico op diabetes type 2 het verhoogt je risico op bewegingsproblemen en dat is wel een probleem we zijn met zijn allen daarmee bezig hoe groot is dat probleem nou laat ons even kijken we hadden het daarstraks al erover we hebben 75 miljard mensen op de aarde 19 miljard daarvan die hebben last van overgewicht en 600 miljoen hebben last van obesitas nou dat zijn zulke grote getallen dat is heel erg veel en sinds 1980 is dat verdubbeld wat betekent dat nou wereldwijd 1 op de 12 mensen maar in nederland wij zijn hier nederland de bv nederland dit is de zaal nederland 50 van de mensen in nederland hebben last van overgewicht dus jullie helaas hebben last van overgewicht en 1 op de 7 mensen in nederland 14 hebben last van obesitas en dat is dan zeg maar ongeveer deze groep mensen hier dus als we daar straks op terugkomen weten we ongeveer hoe het verdeeld is maar hoe groot is dat probleem nou hoe complex is dat probleem er is een onderzoek geweest in engeland en die hebben dat heel eenvoudig in kaart gebracht en dan snap je het al er zijn dus heel veel factoren die daarop van invloed zijn en dat varieert van opleidingsniveau beschikbaarheid van gezond voedsel maar ook is het veilig om op straat te fietsen en te wandelen en ook de hoeveelheid stress er zijn heel veel factoren die daarop van invloed zijn er zijn hier ongeveer 8 sectoren 108 elementen dus het is complex hè en je kan je ook voorstellen als je één van deze zaken aanpakt dat je daarmee het probleem niet hebt weggenomen maar het mooie is dat eigenlijk in het centrum daar zie je het belangrijkste dat is de energiebalans in het engels zeggen ze dat heel mooi al wat je eet en niet verbrandt daar blijf je op zitten nou dat is duidelijk maar terugkomen het is dus een complex probleem wat je wel ziet is dat iedereen daar toch een eenvoudig antwoord op heeft nou laten we eens gaan kijken een hele mooie quote voor elk complex probleem bestaat er een antwoord dat duidelijk simpel en fout is en dat komt ook wel een beetje terug in de uitdagingen die we krijgen nou voor deze helft van de zaal jullie hadden last van overgewicht wat doe je dan nou dan gaan we naar de bibliotheek of naar de boekhandel laten we online eens een boekje gaan bestellen een dieetboek dat is de makkelijkste oplossing hoeveel dieetboeken kan je online bestellen op bolcom iemand een idee ik hoor 50 ik hoor 200 nog iemand anders 2000 het zijn er 3091 in nederland als we nu gaan kijken want een mooie boekenkast vol maar we zitten inmiddels op de wereld nog altijd heel veel mensen dan gaan we op de grootste online boekenwinkel zoeken hoeveel boeken dieetboeken kun je online bestellen we hadden er in nederland 3000 het zullen er meer zijn nog iemand anders een idee ik hoor daar 4000 een beetje meer jongens 10000 ik haal jullie uit de brand 220548 vorige week misschien dat er deze week weer meer zijn dus je ziet ook daar dat het een complex probleem is want zelfs als je een oplossing zoekt dan weet je eigenlijk niet eens waar je moet beginnen daar zit dus de uitdaging die uitdaging is complex voor de consument maar die is ook complex voor de producent nou als we gaan kijken dan we denken vaak in goed en slecht nou we hadden net al richtlijnen gehad laten we eens even gaan kijken goed slecht zout iemand een idee goed of slecht slecht ja ik hoor slecht zout moeten we minder eten maar we moeten niet vergeten als je geen zout hebt ga je dood wel dat is lastig een andere transvetzuren goed of slecht ik zie een aantal mensen een beetje glazig kijken transvetzuren gedeeltelijk geharde vetten goed of slecht nog steeds blanco gezichten slecht ik zou zeggen slecht en het mooie van transvetzuren leek te zijn dat je harde vetten kon krijgen het leek echter dat dat slecht was voor je cholesterol en het mooie is dat de industrie die inmiddels uit het grootste gedeelte van onze producten al heeft gehaald en jullie wisten het niet eens een laatste dan laat ons een even kijken e330 enummertje erin slecht iemand anders e330 weer blanco gezichten e330 is citroenzuur citroenzuur zit in elke levende cel van je lichaam dat maak je zelf aan fantastisch product kun je hele mooie dingen mee doen maar je ziet dus ook daar het verwarrend het is complex wat moeten we daar nou mee laten we nog eens een andere pakken eens even kijken ik leg deze even weg portiegrootte onderweg willen we een keer iets drinken en dan kunnen we kiezen altijd uit klein standaard of groot wat kiezen we dan uit onderzoek is aangetoond dat we eigenlijk allemaal gemiddeld tussen klein en standaard kiezen maar wat hebben we inmiddels gedaan we hebben klein standaard en groot en welke kiezen we nu ja weer tussen klein en standaard in want we willen eigenlijk niet klein we willen ook niet echt zo groot ik wil gewoon eigenlijk normaal zijn maar één van de dingen die we vergeten zijn is dat toen we vroeger bij ons oma een kopje thee gingen drinken wat was toen de maat het was een mooi schoteltje een mooi boordje toen was dat de standaardmaat dus wat we zien is dat eigenlijk die maten we weten het eigenlijk niet meer precies we willen allemaal standaard maar wat is nu standaard dus die keuze die moeten we zelf maken en dit is niet iets van de laatste 20 jaar er is namelijk heel mooi onderzoek geweest door wansink & wansink in amerika en die hebben de beroemdste maaltijd aller tijden onder ogen genomen het laatste avondmaal 52 schilderijen hebben ze bestudeerd over 1000 jaar dus ze hebben een historie van 1000 jaar in maaltijden eens bekeken en ze hebben ook daar gekeken naar de portiegrootte ook naar andere zaken hoeveel denken jullie dat die portiegrootte gestegen is in 1000 jaar 655 dus je ziet dat het niet iets van de laatste jaren is dat is iets dat heel lang al gaande is wat is er echter de laatste 3040 jaar gebeurd die maaltijden zijn vergroot maar wij zijn minder gaan bewegen en dan komen we terug op die energiebalans op wiens bordje ligt het nou the lancet een beroemd tijdschrift heeft heel mooie series gepubliceerd 'the obesity series' ze hebben gekeken naar verschillende rollen we hebben de overheid we hebben het individu wij de scholen de 'retailers' de supermarkten en de producenten en die hebben daar allemaal een rol in te spelen en het is daarom heel belangrijk dat we als consument als individu moeten we die rol nemen maar als industrie is het belangrijk dat we die rol opnemen ik als levensmiddelentechnoloog sta daarvoor we hebben die rol ook al genomen alleen vaak niet zichtbaar zout is verlaagd transvetzuren zijn eruit gehaald verzadigd vet is verlaagd de portiegrootte is verlaagd we hebben een hele andere labeling dan voorheen maar ook de allergenen zijn veel duidelijker gelabeld en we hebben daar veel richtlijnen voor belangrijk is dat jullie heel veel van die nieuwe richtlijnen niet zien sinds 2010 hebben wij onze portiegrootte gemaximaliseerd op 250 kcal maar heel vaak zien we dat niet het is belangrijk dat die zelfregulering die werkt en daar moeten we mee verdergaan maar goed dat is allemaal mooi rob verhagen maar wat ga jij daar nou aan doen ja dat is een mooie want ik wil graag dat onze producten alle producten in het schap beter worden wat betekent nou beter als we nu terug gaan kijken naar die zoutverlaging die zoutverlaging als je die te snel doet wat doen we dan als consument dan zeggen we dat product smaakt anders en dat willen we niet meer of we doen er thuis weer zout bij dus dat is lastig dus als levensmiddelenindustrie moet je dat dan heel langzaam doen tegelijkertijd zien we ook dat we als consument vaak een gedragspatroon hebben dat lastig is er is een interessant onderzoek geweest in frankrijk door professor chandon en die heeft zonder dat wij dat wisten snoepjes besteld in een mooie winkel en die heeft er eigenlijk dingen op laten drukken op een aantal heeft hij 'standard' laten drukken en op een aantal andere heeft hij 'light' of 'low fat' laten drukken 'light' 'low fat' in dit soort levensmiddelen betekent dat er dus 30 minder vet in zit dan zit er dus wel iets anders in maar hoe denk je dat de consument dan reageert als de consument een keuze gaat maken ze mogen een portie pakken dan pakken ze eigenlijk een normale portie een standaard ongeveer 192 kcal nou dat is een mooie portie echter als je kijkt naar de consument die 'light' of 'low fat' gaat pakken dan gaan we meer pakken en de snoepjes zijn niet anders er was alleen maar 'low fat' op gedrukt dus wat je ziet is dat onze keuzes als we 'light' of 'low fat' producten hebben in plaats van te zeggen dat is mooi dan heb ik een voordeel dan krijg ik minder kilocalorieën neen dan is ons gedrag dat we meer gaan eten en in deze studie was het uiteindelijk 46 meer dus dat is lastig dus herformuleren moet je langzaam doen maar als je het doet en je communiceert het op de verkeerde manier dan gaan mensen niet minder eten maar dan gaan ze juist meer eten nou hoe zit dat nu met chocolade chocolade iedereen 9 van de 10 mensen houdt van chocolade de tiende persoon liegt meestal maar chocolade is geen maaltijdvervanger het is geen dagelijkse snack we proberen geen gezonde chocolade te verkopen het is geen broccoli het zijn geen worteltjes het is een traktatie en ik denk dat is belangrijk om te zien en daarom staan wij ervoor dat we meer kleinere porties willen aanbieden wat is nu mijn aanbeveling naar jullie als levensmiddelentechnoloog als individu als consument nou eigenlijk is die aanbeveling heel erg simpel stap 1 van mindless naar mindfull dus in goed nederlands van graaien en snaaien naar genieten en dat is wel belangrijk want we eten vaak meer dan hetgeen ons plezier geeft we eten door voor meer eten uit gewoonte uit rituelen of het lijkt gezellig maar uiteindelijk als je eet voor je plezier en je genot zorg dan dat je mindfull daarvan geniet en de tweede uitdaging en dan komen we hiernaar terug wat is jouw standaard kies jouw standaard als we allemaal een maatje kleiner kiezen wordt het vanzelf een maatje minder obesitas is een complex probleem we moeten er samen aan werken en het ligt op verschillende bordjes dat is eigenlijk best een gek woord hè 'consumeer' het gaat juist in dit geval om 'minder' het gaat om 'meer genieten' het is bijna lunchtijd ik ben benieuwd wat er dadelijk op jullie bordje ligt dankjewel
|
13 |
+
6
|
14 |
+
dank u wel ik stond op een podium met een dirigeerstok daar mocht ik mooi orkesten en koren dirigeren nu sta ik met technologie op het podium om jullie mee te slepen in het verhaal van mijn leven in het verhaal dat gaat over klassieke muziek voor iedereen niet voor een hele kleine groep ik ga jullie laten zien hoe klassieke muziek voor mij een avontuur is geweest dat eerst heel persoonlijk was en daarna een passie was die ik ging delen met hele grote groepen uit het publiek en tot slot en dat is mijn huidige missie zorgen dat iedereen in de wereld toegang heeft tot klassieke muziek en dat gaat waarderen het is ooit ergens begonnen natuurlijk het was helemaal niet zo ik was helemaal niet zo jong toen ik aan klassieke muziek begon ik was pas 21 en er was iets dat er voor zorgde dat de vlam in de pan sloeg ik ging muziekwetenschap studeren en ik had er helemaal geen verstand van dat was iets en toen ik muziek ging studeren dacht ik ja ik moet toch ergens beginnen met luisteren en mijn broer die toen in amerika woonde die zei rob ik ga met je meeluisteren we gaan beginnen met gustav mahler nooit van gehoord zijn zevende symfonie koop hem maar dan gaan we alle twee luisteren nou zo gezegd zo gedaan we gingen samen naar gustav mahler luisteren en dat sloeg in als een bom kijk dat ging zo hier in een schitterende uitvoering van claudio abbado met het luzern festivalorkest dit was een bliksemflits er gebeurde iets met me wat nog nooit in mijn leven was gebeurd en wat was dat dan precies om het goed te kunnen uitleggen gaan we een paar stapjes terug dit was de mokerslag maar ergens is dat natuurlijk bij mij begonnen zoals dat bij iedereen begonnen is ik heb een voorgeschiedenis ik ben opgegroeid met muziek helemaal niet klassiek zoals eigenlijk iedereen dat heeft gehad laten we eens door mijn lp's en cd'tjes heen lopen van dat begin the beatles kan niet anders zes jaar mijn moeder maakte me enthousiast elton john kwam daar achteraan heerlijke muziek de eerste lp die ik kocht maar er was natuurlijk veel meer moois the eagles toen was ik twaalf dertien volop genieten koude rillingen electric light orchestra al een beetje klassiek maar prachtige muziek stevie wonder wie heeft er niet genoten van songs in the key of life maar er kwam nog veel meer achteraan popmuziek was mijn inspiratie pretzel logic van steely dan dat was de volgende fase meer jazzy maar het kwam weer terug bij the beatles want the beatles is een rode draad in mijn leven dat is de klassieke muziek van de popmuziek dus dat is een beetje mijn voorgeschiedenis maar wie heeft er nou voor gezorgd dat ik gepassioneerd werd moet ik wel de juiste slide naar voren hebben mijn vader mijn vader was een groot liefhebber van jazzmuziek en ik zie hem nog zo staan hier zit hij achter zijn saxofoon ik zie hem nog zo staan in de kamer als frank sinatra opstond dan stond hij te swingen met de big band hij dirigeerde de big band in de kamer en de koude rillingen liepen over zijn rug dat was nog eens passie van hem heb ik geleerd wat passie was maar ik kreeg ook de gelegenheid van mijn ouders om muziek te maken daar ben ik ze heel erg dankbaar voor even een paar voorbeelden ik mocht bij piet balen gitaarles krijgen dit heb ik gespeeld dat kon ik toen dat was echt helemaal in het begin toen ging ik orgel spelen emile simonis de muziek van jimmy smith een beetje jazzy nou echt goed heb ik het nooit geleerd hoor en toen maakte ik de stap naar klassiek piano mozart zijn eenvoudige symfonie simpeler kan niet maar mooier kan bijna ook niet dus ik had wel geluk ik mocht muziek leren van mijn ouders vervolgens dacht ik hier kijk ik heb een stuk geschiedenis ik heb passie ik heb wat geleerd maar om nou te zeggen dat ik wat van wist nee ik wist helemaal niks net als heel veel anderen ik had geen verstand van muziek daarom ben ik muziekwetenschap gaan studeren en dat was een groot avontuur ik ga jullie een beetje meenemen in dat avontuur de ontdekkingstocht door de klassieke muziek neem er eventjes de tijd voor dat vind ik belangrijk ik ga nu heel veel koude rillingen krijgen en ik hoop dat jullie ook een paar koude rillingen gaan krijgen daar komt ie de ontdekking van de klassieke muziek monteverdi de mariavespers muziek rond 1610 mooier kan bijna niet bij mij rollen ze en de leraren bij muziekwetenschap namen allerlei muziek voor me mee de notenkraker van tsjaikovski balletmuziek ik had er nog nooit van gehoord zo mooi ik wist niet dat het zo mooi was en wat te denken van bach de brandenburgse concerten ook weer één van mijn eerste klassieke lp's volop van genoten hier het combattimento consort uit amsterdam of viool de vertaling van het hart de vertaling van de menselijke stem op een instrument hier in thaïs massenet prachtig uitgevoerd door joshua bell wagner die schrijft opera's van zestien uur zoals de walkurerit hoort u hier heftige muziek ook vaak in film gebruikt de messiah we kennen hem allemaal het is 'music for the millions' maar hoe mooi ik leerde de amerikaanse muziek kennen george gershwin later john adams an american in paris sensationeel en wie kent deze opening niet kennen we allemaal de beste opening ooit geschreven beethoven meer hoeft niet en we krijgen de volgende the rite of spring le sacre du printemps honderd jaar geleden exact 100 jaar geleden een sensatie slachtoffers bij de eerste uitvoering de politie moest het podium opkomen omdat het publiek het podium oprende om de musici en de balletdansers te belagen of de hemelse koormuziek uit de renaissance giovanni palestrina met zijn missa papae marcelli ja het kon niet anders de passie was geboren maar de ontdekkingstocht ging verder ik wilde meer ontdekken en er is een heel mooi moment in mijn leven en dat moment is dat ik met vrienden ging fietsen in de dordogne daar waren we in sarlat een heel mooie middeleeuwse stad in sarlat daar zat in de kerk in de kathedraal was er een orkestje en daar zat een pianist we liepen er zomaar naar binnen ik ging zitten en ik werd wederom als een mokerslag getroffen door de opening van het 20e pianoconcert van mozart pianissimo sorry ik moet onderbreken want er is nog veel meer te vertellen dus de muziek was goed bij mij binnen gekomen en nu gingen we op bedevaartstocht ik samen met mijn vrouw we gingen naar wenen want mozart en mahler dat waren de componisten die helemaal al in mijn gestel zaten we gingen naar wenen om te ontdekken waar ze geboren waren gewerkt hadden wat er allemaal gebeurd was dat was een prachtige ontdekkingsreis maar er was ook een botsing tijdens die reis we gingen naar de musikverein een tempel net als het concertgebouw een prachtige concertzaal we hoorden de vijfde symfonie van bruckner terug naar ons appartementje in de tram zei ik tegen mijn vrouw dit is toch echt het allermooiste wat we ooit hebben meegemaakt ze keek mee aan en zegt wie kan er nou van bruckner vijf houden dat is toch verschrikkelijk er bestaat geen mens op de wereld die dit mooi kan vinden we hebben echt een vlammende ruzie gehad en ik dacht o dus wat ik zelf beleef dat is niet vanzelfsprekend dat iemand anders dat ook beleeft ik was totaal verslaafd maar dat wilde niet zeggen dat andere mensen die verslaving hadden dat was dus een privéervaring alles was nog persoonlijk wat ik meemaakte totdat ik ging dirigeren en lesgeven dat was het moment dat ik muziek ging delen met anderen een nieuwe fase in mijn leven eerst koordirectie ik mocht tijdens mijn studie koren gaan dirigeren echt geweldig met vijftien zestien twintig dertig zangers koormuziek beleven je moet voorstellen dat je met elkaar deze muziek maakt het salve regina van francis poulenc wat een gelukzalige ervaring sorry poulenc de tweede ervaring ik mocht orkestdirectie gaan studeren dat deed ik samen trouwens met hans welle in hilversum we kregen de kick van het dirigeren van 75 mensen samen muziek maken echt tot een heel hoog niveau komen dat was fantastisch maar lesgeven onderwijzen dat was nog weer een volgende fase want dan sta je voor een groep mensen en dan mag je je enthousiasme dan mag je je kennis overbrengen op anderen dat is geweldig ik merkte toen tijdens dat lesgeven dat ik niet alleen zelf koude rillingen had maar dat ook de mensen die met mij dat deelden dat zij ook koude rillingen kregen ik weet nog zo goed ik gebruikte altijd aan het eind van mijn cursus het klarinetconcert van mozart daar is mozart weer en met dit klarinetconcert van mozart gebeurde met iedereen wat met mij gebeurde koude rillingen heel mooi gespeeld door karl leister jaren geleden ik heb hem weer gevonden hij staat ook op cd een prachtige uitvoering ik deed wat ontdekkingen ik ontdekte dat klassieke muziek een universele taal is het is niet alleen voor mij niet alleen voor degene met wie ik het deel ook in china ook in afrika ook in amerika overal als je er je best voor doet kun je ontzettend genieten van klassieke muziek omdat het een universele taal is wat ik ook ontdekte is dat als je de taal leert begrijpen en als je er naar luistert en vaker luistert dat het je zielsgelukkig maakt maar daar moet je wel erg je best voor doen dat gaat niet vanzelf popmuziek dat wordt geplugd dat hoor je veertig keer en dan denk je o dat is een leuk liedje klassieke muziek dat hoor je één keer en ja wat weet je dan nog je moet eens voorstellen dat je een klassiek nummer veertig keer hoort ach dan komt het veel verder dan de popmuziek natuurlijk ik kreeg een missie en mijn missie was ik wilde klassieke muziek toegankelijk maken voor iedereen niet beperkt tot een kleine elitaire groep maar voor iedereen dat is mijn missie geworden in mijn leven en op dat moment was ik natuurlijk nog bezig met de liefhebber maar om iedereen enthousiast te kunnen maken moest ik kunnen uitleggen wat nou het bijzondere van klassieke muziek was dat vond ik erg moeilijk ik kon mooie verhalen vertellen dat ging allemaal wel vanzelf maar wat is nou het bijzondere het magische van de klassieke muziek dat zag ik voor het eerst toen ik de speelfilm 'amadeus' zag 'amadeus' is voor mij de allermooiste speelfilm over klassieke muziek kijk maar video het begin is eenvoudig ro salieri zijn grote vijand video slechts een hartslag fagotten bassethoorns als een roestige trekzak ro hij beschrijft wat er nou zo bijzonder is video en dan opeens hoog erboven een hobo video een enkele noot hangend onwrikbaar tot dat een klarinet het overneemt te mooi kijk de hele film en u bent overtuigd dus toen wist ik ook een beetje dat je het kon uitleggen wat zo bijzonder was aan klassieke muziek ik ontdekte dat storytelling verhalen vertellen uitleggen er voor zorgde dat de anderen ook allemaal enthousiast werden ik ging het dus delen met liefhebbers dat deed ik als volgt eerst voor mijzelf dat weten we vervolgens ging ik onderwijzen groepen van 10 20 30 vervolgens ging ik dirigeren dat waren wel meer 20 tot 80 mensen ik kreeg de kans om bij kranten te gaan schrijven nou dan bereik je 20 30000 mensen die probeer je allemaal enthousiast te maken of het nou om kritiek of om negatieve of positieve kritiek gaat vervolgens natuurlijk de symfonieorkesten ik heb jarenlang voor orkesten mogen werken geweldig daar zaten 2000 mensen in de zaal of bij het gergiev festival in rotterdam kwamen 25000 mensen naartoe geweldig steeds meer mensen keken met me mee maar en dat is een hele belangrijke het was nog steeds klassieke muziek voor the happy few het was beperkt tot mensen die het hadden meegekregen goed er moest dus nog een stap worden gemaakt hoe krijgen we nou voor elkaar dat klassieke muziek voor de massa is voor iedereen toegankelijk werd een eerste stap daarin was mijn kennismaking met peter kroone en peter kroone dat was een man die organiseerde opera's in ahoy hij noemde dat stadionopera's ik heb met hem mogen meemaken hoe hij in voetbalstadions in parijs in shanghai in stuttgart voor 80000 mensen aïda carmen traviata bracht op een zeer hoog niveau mensen genoten allemaal ontzettend dat was dus klassieke muziek voor een hele grote groep mensen en ze genoten net zozeer als de mensen in het concertgebouw klassieke muziek was dus ineens voor iedereen maar nog lang niet genoeg ik stopte bij de orkesten omdat ik dacht ja ik ben altijd voor mijn eigen zaal bezig maar dat publiek zit wereldwijd er zijn miljarden mensen die er nog niks vanaf weten en technologie was hetgene wat mij kon helpen om iedereen te gaan bereiken allereerst was daar breedband ik ben dus met het internet aan de slag gegaan en vanaf 2006 via een groot portal dat we opzetten dachten we dat breedband gaat er voor zorgen dat iedereen er van gaat genieten nou ja apps bestonden nog niet iphones bestonden nog niet het was hartstikke moeilijk bijna niemand deed mee maar ik wist wel dat daar heel veel potentie zat en toen mocht ik terugkeren naar de oude wereld ik ging naar de televisiewereld en dat is heel interessant want je kunt heel mooie klassieke muziek voor grote groepen brengen een opera in nederland doet al gauw 50 tot 100000 mensen op televisie het mooie programma maestro wat onlangs door de avro is gemaakt dat bracht 14 miljoen mensen voor de televisie dat zijn hele grote aantallen en ze hebben allemaal enorm genoten dus televisie als een heel belangrijk medium maar de nieuw media is natuurlijk veel meer dan breedband en dan televisie want als je een hele mooie opname maakt kun je die op televisie brengen je kunt er een dvd van maken je kunt het tegenwoordig via video on demand bestellen en bekijken youtube is hét kanaal voor de klassieke muziek geworden maar the metropolitan opera brengt klassieke muziek in de bioscoop er zitten dan wereldwijd tienduizenden sterker nog de beste voorstelling bracht 500000 mensen wereldwijd in 5000 bioscopen om naar een opera te kijken dat is sensationeel dus de nieuwe media was een enorme hulp geworden om klassieke muziek te helpen en ik zeg de nieuwe media is de grootste kans die de klassieke muziek in 800 jaar tijd heeft gekregen want de nieuwe media zorgt er voor dat klassieke muziek nu echt toegankelijk is voor iedereen maar daar moeten we wel wat voor doen en we gaan nu naar de eindstreep toe want wat moet je dan doen storytelling is het noodzakelijke virus je moet er meer voor doen omdat je moeilijk kan pluggen je moet heel veel verhalen vertellen dat doe ik niet alleen dat doen veel mensen over de hele wereld zoals leonard bernstein vroeger michael tilson thomas of in nederland onze eigen janwillem de vriend die dat heel vaak doet via 'de wereld draait door ' en andere media de nieuwe media moeten we heel goed gebruiken als distributieinstrument dat doen we en daar bereiken we al heel veel mensen mee maar voor mij zit de toekomst bij de jeugdorkesten jeugdorkesten daar zijn er wereldwijd duizenden van in almere hebben we ons eigen almeers jeugdsymfonieorkest we hebben het utrechts studentenconcert in utrecht we hebben het vuorkest er zijn in nederland 300 jeugdorkesten wereldwijd zijn er een paar honderdduizend jeugdorkesten zij brengen een enthousiasme over dat echt ongekend is ik wil ook gaan afsluiten met de hoop voor de toekomst die in deze drie elementen zit maar vooral in het jeugdorkest even kijken tot slot naar een heel bijzonder fragment van het simon bolivarjeugdorkest uit venezuela geleid door gustavo dudamel dan is klassieke muziek een echt feestje ro de opening van hun nieuwe zaal ro alleen maar jongeren in de zaal ro nou ja bijna (muziek publiek roept 'mambo' en klapt mee) ro ja zo is klassieke muziek natuurlijk echt heel makkelijk bij een heel groot publiek te brengen heel raar maar de hoop voor de klassieke muziek en die is heel groot die begint dus op dit moment in venezuela bij de jeugdorkesten er zijn er 200 in venezuela en ik hoop dat u samen met mij er voor gaat zorgen dat we het allermooiste geluid wat de westerse beschaving heeft voortgebracht bij miljoenen over de hele planeet kunnen brengen dank u wel
|
15 |
+
7
|
16 |
+
welkom frans droog goedenmiddag nog steeds een vleiende introductie ik hoop dat ik hem waar kan maken mijn presentatie heet de leerling en ik en de leerling staat voorop natuurlijk in mijn ogen wie ben ik heel kort is eigenlijk al gezegd frans droog ik ben docent gewoon docent zeg ik meestal biologie en mens en natuur op het wolfert lyceum een daltonschool in bergschenhoek vlakbij rotterdam naast docent ben ik ook bestuurslid van the crowd een organisatie die vindt dat docenten regie over hun eigen professionalisering moeten nemen en die heeft als basis docenten weten het beter dus ze kunnen ook goed van elkaar leren daar heb je geen experts voor nodig soms maar heel vaak niet ik ben organisator geweest van het eerste edcamp in nederland en ook van het tweede dat is een primeur misschien die gaat in februari 2015 plaatsvinden dus houd de social media in de gaten een aanrader hoor ik van veel mensen ik ben ook deelnemer aan united4education dat is een initiatief wat alle positieve ontwikkelingen in het onderwijs gericht op vernieuwing vooral wil verbinden en zo versterken er zijn ontzettend veel initiatieven die van elkaars bestaan niet weten als je dat bij elkaar brengt kan dat een veel grotere stem krijgen dat willen wij gaan doen daar zijn een aantal transitiepaden en mijn speciale transitiepad zal zijn de leerling ik heb ooit op een cursus geleerd dat je je visie moet tonen uitspreken dit is mijn visie zwartwit oh nee dit is een plaatje over evolutie kun je ontzettend veel plaatjes over vinden wat ik hiermee wil aangeven is evolutie is mijn favoriete onderwerp dna is mijn favoriete onderwerp als bioloog erfelijkheid alles wat ermee te maken heeft en je ziet hier wij stammen af van een organisme waar apen ook van afstammen wij hebben leren lezen en we kunnen nu dingetjes op computers doen maar wat gaat er nu vervolgens gebeuren op menselijke schaal één mens gaat de evolutie niet meemaken maar dit plaatje staat ook symbool voor mijn visie op onderwijs het onderwijs verandert ook tenminste ik vind dat het moet veranderen omdat de samenleving verandert de leerlingen van nu hebben zo ongelooflijk veel informatiebronnen moeten zo ongelooflijk veel keuzes maken dat wij hen daarin moeten begeleiden wat er over 20 jaar nodig is aan kennis weten wij niet dus ik denk dat het handig is om kinderen te leren die kennis zelf te gaan vergaren want het zou zo maar kunnen gebeuren dat de evolutie deze richting opgaat iedereen gaat muziek maken geweldig nummer van pearl jam overigens het zou ook kunnen dat dit gaat gebeuren we gaan allemaal nog meer eten en het onderwijs kan daar invloed op uitoefenen denk ik en ik vind dat ik dat zoveel mogelijk moet proberen en ik wil dat heel graag delen ik ben begonnen als onderzoeker als moleculair bioloog ik heb echt met zo'n raar ding in mijn handen gestaan daarmee kan je dna aflezen het gaat tegenwoordig met machientjes die onderzoekshouding die ik daarvandaan heb overgehouden kwam mij van pas en zat mij in de weg toen ik docent werd want ik kwam op een school en ik zei waarom doen jullie dit eigenlijk zo kan ik vinden hoe dat werkt waarom dat werkt en het antwoord was meestal dat weten we eigenlijk niet ik zei maar zou het niet zo en zo kunnen dat weten we eigenlijk niet dus ik heb altijd die onderzoekshouding behouden en ik probeer altijd te kijken wat werkt en wat kan ik toepassen wat ik ook geleerd heb is als je niks verandert verandert er niks dat kun je op een tegeltjeswijsheid lezen als als je doet wat je deed krijg je wat je kreeg en ik denk niet dat dat goed is voor onze leerlingen ik denk niet dat het goed is voor onze samenleving als wij steeds hetzelfde blijven doen bijvoorbeeld gebruik van technologie verandert de samenleving gigantisch dat gaat steeds sneller dus daar moeten wij iets mee vind ik een van de dingen die me ontzettend stoort in het onderwijs is dit vrij bekende plaatje denk ik maar ik laat hem toch zien alle leerlingen worden op dezelfde manier getest hoe verschillend ze ook zijn hier moeten ze de boom inklimmen en wat mij betreft kun je met dit soort dingen de boom inklimmen dat is niet handig niet alle leerlingen kunnnen hetzelfde niet alle leerlingen hoeven hetzelfde te kunnen niet alle mensen hebben hetzelfde beroep niet alle mensen hebben dezelfde kennis nodig om dat beroep goed uit te voeren allemaal wel leuk zo'n quote en die plaatjes natuurlijk maar wat moet je daar nou mee ik probeer dat toe te passen ik heb een aantal dingen opgeschreven die ik in mijn dagelijkse lespraktijk toepas de bovenste twee zal ik wat meer over vertellen later sla ik even over flipping the classroom is ik weet niet hoe bekend het is heel simpel gezegd de directe instructie haal je uit het klaslokaal doe je vooraf door het op te nemen of hoe dan ook dat betekent je hebt meer tijd in de les als je meer tijd hebt in de les kun je elke leerling meer tijd geven individueel je kunt andere activiteiten doen dus de les wordt efficiënter effectiever besteed je moet wel van te voren bedenken hoe je dat gaat doen filmpje opnemen en zeggen kijk maar dat werkt niet het principe werkt heel erg goed ik ben onderzoeker dus ik heb het onderzocht in mijn geval leverde het een verhoging van het wiskundecijfer van een halve punt dat is redelijk hoog vind ik ik lees ook het nodige en praat daar regelmatig met docenten over en het verbaast mij jullie doen dat natuurlijk allemaal ook ik weet niet of ik het hoef te vertellen maar het verbaast mij hoe weinig docenten dat doen en hoe weinig zij dat gebruiken hele simpele trucjes die je lessen efficiënter maken met z'n tweeën achter de computer is efficiënter als ik dat vertel op school zeggen de meesten nee dat is helemaal niet waar dan gaan ze kletsen klopt dan gaan ze kletsen over de lesstof als je het goed organiseert dat wordt efficiënter dat is wetenschappelijk aangetoond kun je gewoon doen heb je ook minder computers nodig verboden vingers op te steken ook een heel bekend voorbeeld als je kinderen hun vinger op laat steken zijn het ongeveer 20 van de kinderen die steeds maar antwoord geven op jouw vraag 80 doet dus niet mee als je kinderen verbiedt hun vinger op te steken doet 100 mee want jij bepaalt wie antwoord moet geven dus kinderen kunnen zich niet meer verstoppen en kinderen die niet durven omdat ze niet zo assertief zijn krijgen ook een kans om antwoord te geven heel eenvoudig in principe de uitvoering is lastig want je hebt de neiging om wel kinderen die hun vinger opsteken de beurt te geven maar er ligt gewoon een kaartje op mijn bureau niet doen flipping the classroom kun je ook uitbreiden je hoeft niet zelf filmpjes te maken mijn hoofdvak is biologie en bij biologie zijn er ontzettend veel filmpjes dus die ga ik niet maken ik ga ze gewoon opzoeken dat geeft mij de mogelijkheid om zonder boek les te geven boekloos biologie hoe ziet dat eruit in de uitvoering ik zit ongeveer tweederde van mijn les in het computerlokaal kinderen krijgen de opdracht om iets op te zoeken en dat bij mij in te leveren in hun eentje in tweetallen viertallen dat verschilt per opdracht en ze krijgen van mij ik doe dat thuis respons op die opdrachten wat gebeurt er zij kunnen niet leren voor de toets letterlijk niet en figuurlijk niet zij kunnen niet vlak voor de toets leren want ze hebben geen boek op het moment dat ze dat doorhebben vragen ze hoe moeten we dan leren dan zeg ik dat zit je de hele dag te doen toch in mijn les in ieder geval en dan zal blijken dat je dus kunt leren tijdens de les best handig want je zit toch op school dat leidt inderdaad tot reacties als hé meneer ik wist niet dat ik dit allemaal wist ik zeg ik wist het ook niet maar ik hoopte het wel ik doe dit nu drie jaar en het werkt heel erg goed testen niet toetsen wil zeggen ik hou niet van toetsen nakijken dus ik probeer dat te vermijden ik heb wel gelezen dat het handig is om te toetsen want daar leren kinderen van dus ik heb daar van gemaakt testen want ik heb ook gelezen als je kinderen vaker test sneller nadat ze nieuwe stof hebben opgenomen dan gaan zij die stof beter onthouden en ze worden ook getraind in het terughalen van die stof dus het reproduceren van aanwezige kennis zorgt dat ze dat beter kunnen en zorgt ook dat die kennis beter behouden blijft als je dat digitaal doet heel weinig werk ik heb twee motto's 'doen wat je wilt' en 'weten wat werkt' 'doen wat je wilt' wil zeggen als je een idee hebt en je zou dat willen doen moet je het gewoon doen en dat betekent dat je dan iets gaat doen wat jij zelf heel graag wilt waar je zelf heel erg goed in bent daardoor worden jouw lessen automatisch beter want je hebt er lol in mijn leerlingen hebben pech of geluk dat mijn favoriete onderwerp dna erfelijkheid evolutie is heb ik net verteld daar krijgen zij dus heel veel van krijgen ze te weinig van het andere nee ik zorg er voor dat ze van alle andere onderwerpen voldoende krijgen om het examen te halen maar ze krijgen heel veel van toevallig het onderwerp dat ik leuk vind voor iedere docent is dat anders is dat erg dat niet alle kinderen precies hetzelfde leren nee vind ik niet 'weten wat werkt' vind ik wel belangrijk als je kennis hebt opgedaan over hoe iets werkt kun je dat gebruiken ik vind het een verplichting voor mijzelf en voor alle docenten om te zorgen dat ze weten wat werkt ik zie heel veel mensen die eigenlijk na een x aantal jaren en x is soms één niets meer bijleren die geven gewoon les die hebben de standaardles uitleg kinderen luisteren of niet opdrachten maken nakijken er is het idee er is geleerd er is gewerkt door de docent en door de leerling ik betwijfel dat ten zeerste als dat echt zo zou zijn zouden niet zo veel leerlingen elke les vlak voor een toetsweek wij hebben volgende week toetsweek aan mij vragen meneer mag ik leren voor dat en dat vak want en er staat in kleine lettertjes 'niet doen is ook doen' dat zouden eigenlijk de grote letters moeten zijn ik vind dat je iets moet doen en niet doen is ook een keuze en dat is denk ik de verkeerde keuze deze zit er in om even een overgang te maken naar de leerling want het ging tot dusver vooral over wat ik vind het probleem met communicatie is dat er vooral geluisterd wordt om een antwoord te geven en niet om te begrijpen dus we zitten als we luisteren vooral te denken wat voor antwoord ga ik geven en niet zozeer wat zegt die persoon nou eigenlijk de leerling de leerling staat centraal dat zie je hier duidelijk maar staat hij ook centraal er is binnenkort een bijeenkomst die heet 'stem van de leerling' georganiseerd door het nivoz in rotterdam een hele goede organisatie die heel veel goeds voor onderwijs en leerlingen doet in de beschrijving van die bijeenkomst staat centraal staat de vraag 'waarom en hoe kan de stem van de leerlingen vergroot gehoord en gewaarborgd blijven' u raadt het al er zijn geen leerlingen aanwezig ik snap dus niet hoe je dat kunt doen zonder leerlingen is dit dus wat wij willen dit is niet wat ik wil dit is wel en misschien lichtelijk overdreven wat er vaak gebeurt ik vind dus dat je moet luisteren naar leerlingen dat is nog helemaal niet zo makkelijk honden kunnen dat heel erg goed maar geluid opvangen is iets anders dan luisteren ik zal dat proberen te illustreren door te kijken naar hoe leerlingen luisteren dus proberen te luisteren naar hoe leerlingen luisteren wat is het verschil tussen die twee nummers de eerste is 20000 keer bekeken die andere 50 miljoen keer de eerste is in mijn beleving hoe leerlingen ons docenten vaak horen die tweede is hoe we misschien zouden moeten praten en die dreun ik weet niet hoe we die erin krijgen ik zal twee dingen vertellen over wat ik dan echt doe met leerlingen waar zij bij betrokken zijn de eerste is 'genius hour' dat komt bij google vandaan 20 van de tijd konden googlewerknemers besteden aan wat zij maar wilden eén dag in de week dat is door angela maiers een amerikaanse docente overgenomen zij heeft die slogan eronder gezet 'iedereen is een genie ergens in en de wereld kan ieders bijdrage gebruiken' dan moet je wel ontdekken wat jouw genie is waar dat zit en hoe je dat kunt gebruiken nou dat is niet zo moeilijk ik geef mens en natuur in klas 2 dat is een vieruursvak eén uur in de week mogen leerlingen doen wat ze willen daar is geen handleiding voor alleen een paar richtlijnen die richtlijnen het moet een beetje binnen het vak passen er moet iets geleerd worden bij voorkeur wordt er iets gemaakt hoeft niet bij voorkeur in een groepje hoeft niet ze mogen zelf kiezen welke van de vier uur ze gebruiken ze mogen meer gebruiken ze mogen minder gebruiken afhankelijk van wat zij willen er moet iets gepresenteerd worden vorm helemaal vrij als ze andere leerlingen maar iets leren dit zijn quotes die ik heb gehoord zal ik verder niet toelichten dit zijn wat foto's van de leerlingen die de presentaties doen en ik wil me alleen op het meisje in het midden richten lucy lucy ik wist niet wat zij aan het doen was iets met robots iets met programmeren ik zei ik zie jou niks doen ja ik doe 't meeste thuis nou de presentatie kwam ik dacht ik ben benieuwd lucy begon haar presentatie ze was naar de tu delft geweest had een video gemaakt van een interview met een professor daar zijn naam weet ik niet meer helaas die haar een half uur lang heeft laten zien de meest moderne robot die ze daar hebben hoe die zelf kan leren ik dacht nou mooie presentatie lucy toen ging lucy verder zij had ook een robot gebouwd lego mindstorms had ze daarvoor nooit gedaan had ze zichzelf geleerd ze ging aan de leerlingen laten zien in de klas zo moet je programmeren en dan gaat er dit gebeuren er zaten drie verschillende sensoren op die robot die demonstreerde ze allemaal die les liep een kwartier uit geen leerling zei meneer het is tijd dat maak je niet vaak mee al deze leerlingen hebben iets gedaan wat ze zonder die optie om zelf te kiezen nooit gedaan hadden want dat zit niet in het curriculum of in het programma van mens en natuur zij kregen een uur de tijd daarvoor en hoe kan ik die één uur daaraan besteden wat ze normaal moeten doen in vier uur doen ze nu gewoon in drie uur want ze willen dit heel graag doen als laatste wil ik noemen dit is zeer recent vorig jaar aan het eind van het jaar mocht ik een dag moest ik een dag vullen met mijn leerlingen ik heb ze gevraagd hoe zouden jullie willen leren daar kwam van alles moois uit daar zou ik een uur of twee of drie over kunnen vertellen eén ding wat heel mooi was was het 'education design lab' dat leerlingen hebben opgericht dat was gebaseerd op één zinnetje wij willen het leerrendement van de lessen verhogen kinderen uit drievwo zeggen dat ze het leerrendement willen verhogen nou de minister die is als die dat zou horen zij hebben een brief geschreven aan de schoolleiding hoe zij dat willen doen ik heb hier een blog over geschreven de schoolleiding is nog bezig met beslissen hoe wij dit moeten organiseren maar er zijn al drie kranten die deze kinderen willen interviewen gewoon om het idee wat ik van die leerlingen heb geleerd is je moet niet denken in onmogelijkheden want in onmogelijkheden zitten ook mogelijkheden heeft u nog vragen ja die heeft u en wel de volgende gaat het wel eens mis ja ik verzin van alles nieuws elk jaar minstens één ding gaat wel eens mis steeds minder vaak maar dat is niet erg want het wordt langzamerhand wel beter moet je er eigenwijs voor zijn ja 'eigen' wil zeggen je hebt je eigen mening die moet je zoveel mogelijk handhaven 'wijs' moet je zijn je moet kennis hebben en eigenwijs is een ideale combinatie om te zorgen dat je het ook gaat doen laat je niet weerhouden door je omgeving als jij ervan overtuigd bent dat het goed is moet je het gewoon gaan doen kan het met alles ja 'genius hour' kan met elk vak flip the classroom kan met elk vak vingers opsteken al die dingen die ik heb genoemd kan met elk vak beetje creativiteit nodig of ik nog tips heb ja gewoon doen klinkt heel eenvoudig maar is best lastig heb ik gemerkt maar gewoon doen nou had ik gezegd dat de leerling belangrijk is dus bij mij staat de leerling echt wel centraal in deze cirkel het gaat namelijk over de toekomst van onze leerlingen ook onze toekomst dus die vind ik heel erg belangrijk en daar wil ik graag een bijdrage aan leveren ik wil u bedanken voor het luisteren en ik hoop dat op z'n minst één iemand van jullie maar het liefst allemaal natuurlijk langer dan vandaag dus ook morgen en overmorgen iets hiervan meeneemt waardoor zijn lessen ietsje beter worden en bovenaan staat mijn volgende presentatie en ook mijn volgende les zal weer ietsje beter worden dank u wel
|
mozilla-foundation_common_voice_8_0_nl_test_eval_results.txt
ADDED
@@ -0,0 +1,2 @@
|
|
|
|
|
|
|
1 |
+
WER: 0.03930940098957785
|
2 |
+
CER: 0.012243905790093903
|
preprocessor_config.json
ADDED
@@ -0,0 +1,10 @@
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
1 |
+
{
|
2 |
+
"do_normalize": true,
|
3 |
+
"feature_extractor_type": "Wav2Vec2FeatureExtractor",
|
4 |
+
"feature_size": 1,
|
5 |
+
"padding_side": "right",
|
6 |
+
"padding_value": 0,
|
7 |
+
"processor_class": "Wav2Vec2ProcessorWithLM",
|
8 |
+
"return_attention_mask": true,
|
9 |
+
"sampling_rate": 16000
|
10 |
+
}
|
run-step1.sh
ADDED
@@ -0,0 +1,28 @@
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
1 |
+
python run_speech_recognition_ctc.py \
|
2 |
+
--dataset_name="mozilla-foundation/common_voice_8_0" \
|
3 |
+
--dataset_config_name="nl" \
|
4 |
+
--text_column_name="sentence" \
|
5 |
+
--length_column_name="input_length" \
|
6 |
+
--use_auth_token \
|
7 |
+
--model_name_or_path="/workspace/hug_data/xls-r-2b-22-to-16.encoder.ctc48" \
|
8 |
+
--tokenizer_name_or_path="./" \
|
9 |
+
--output_dir="./output.step1" \
|
10 |
+
--overwrite_output_dir \
|
11 |
+
--num_train_epochs="5" \
|
12 |
+
--per_device_train_batch_size="8" \
|
13 |
+
--gradient_accumulation_steps="4" \
|
14 |
+
--learning_rate="5e-5" \
|
15 |
+
--warmup_steps="2000" \
|
16 |
+
--evaluation_strategy="steps" \
|
17 |
+
--save_steps="500" \
|
18 |
+
--eval_steps="500" \
|
19 |
+
--save_total_limit="4" \
|
20 |
+
--layerdrop="0.0" \
|
21 |
+
--freeze_feature_encoder \
|
22 |
+
--gradient_checkpointing \
|
23 |
+
--chars_to_ignore , ? . ! - \; \: \" “ % ‘ ” � _ \
|
24 |
+
--fp16 \
|
25 |
+
--group_by_length \
|
26 |
+
--do_train --do_eval
|
27 |
+
|
28 |
+
# --overwrite_output_dir \
|
run-step2.sh
ADDED
@@ -0,0 +1,33 @@
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
1 |
+
python run_speech_recognition_ctc_for_cgn.py \
|
2 |
+
--dataset_name="/project_antwerp/xlsr/data/cgn/cgn_dataset_16k" \
|
3 |
+
--train_split_name="train" \
|
4 |
+
--eval_split_name="test" \
|
5 |
+
--text_column_name="text" \
|
6 |
+
--audio_column_name="audio" \
|
7 |
+
--length_column_name="input_length" \
|
8 |
+
--min_duration_in_seconds="1.0" \
|
9 |
+
--max_duration_in_seconds="20.0" \
|
10 |
+
--model_name_or_path="./output.step1/" \
|
11 |
+
--tokenizer_name_or_path="./output.step1/" \
|
12 |
+
--output_dir="./output.step2" \
|
13 |
+
--num_train_epochs="1" \
|
14 |
+
--ignore_data_skip \
|
15 |
+
--seed 43 \
|
16 |
+
--per_device_train_batch_size="8" \
|
17 |
+
--gradient_accumulation_steps="4" \
|
18 |
+
--learning_rate="3e-5" \
|
19 |
+
--warmup_steps="2000" \
|
20 |
+
--evaluation_strategy="steps" \
|
21 |
+
--save_steps="1000" \
|
22 |
+
--eval_steps="3000" \
|
23 |
+
--layerdrop="0.0" \
|
24 |
+
--save_total_limit="4" \
|
25 |
+
--freeze_feature_encoder \
|
26 |
+
--gradient_checkpointing \
|
27 |
+
--chars_to_ignore , ? . ! - \; \: \" “ % ‘ ” � _ \
|
28 |
+
--fp16 \
|
29 |
+
--group_by_length \
|
30 |
+
--do_train --do_eval
|
31 |
+
|
32 |
+
# --preprocessing_num_workers="4" \
|
33 |
+
|
run-step3.sh
ADDED
@@ -0,0 +1,31 @@
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
1 |
+
python run_speech_recognition_ctc.py \
|
2 |
+
--dataset_name="mozilla-foundation/common_voice_8_0" \
|
3 |
+
--dataset_config_name="nl" \
|
4 |
+
--text_column_name="sentence" \
|
5 |
+
--length_column_name="input_length" \
|
6 |
+
--use_auth_token \
|
7 |
+
--model_name_or_path="./output.step2/" \
|
8 |
+
--tokenizer_name_or_path="./output.step2/" \
|
9 |
+
--output_dir="./output.step3" \
|
10 |
+
--overwrite_output_dir \
|
11 |
+
--num_train_epochs="5" \
|
12 |
+
--ignore_data_skip \
|
13 |
+
--seed 44 \
|
14 |
+
--per_device_train_batch_size="8" \
|
15 |
+
--gradient_accumulation_steps="4" \
|
16 |
+
--learning_rate="6e-6" \
|
17 |
+
--warmup_steps="2000" \
|
18 |
+
--evaluation_strategy="steps" \
|
19 |
+
--save_steps="500" \
|
20 |
+
--eval_steps="500" \
|
21 |
+
--save_total_limit="4" \
|
22 |
+
--layerdrop="0.0" \
|
23 |
+
--freeze_feature_encoder \
|
24 |
+
--gradient_checkpointing \
|
25 |
+
--chars_to_ignore , ? . ! - \; \: \" “ % ‘ ” � _ \
|
26 |
+
--fp16 \
|
27 |
+
--group_by_length \
|
28 |
+
--do_train --do_eval
|
29 |
+
|
30 |
+
# --overwrite_output_dir \
|
31 |
+
# --preprocessing_num_workers="8" \
|
run_speech_recognition_ctc.py
ADDED
@@ -0,0 +1,742 @@
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
1 |
+
#!/usr/bin/env python
|
2 |
+
# coding=utf-8
|
3 |
+
# Copyright 2021 The HuggingFace Inc. team. All rights reserved.
|
4 |
+
#
|
5 |
+
# Licensed under the Apache License, Version 2.0 (the "License");
|
6 |
+
# you may not use this file except in compliance with the License.
|
7 |
+
# You may obtain a copy of the License at
|
8 |
+
#
|
9 |
+
# http://www.apache.org/licenses/LICENSE-2.0
|
10 |
+
#
|
11 |
+
# Unless required by applicable law or agreed to in writing, software
|
12 |
+
# distributed under the License is distributed on an "AS IS" BASIS,
|
13 |
+
# WITHOUT WARRANTIES OR CONDITIONS OF ANY KIND, either express or implied.
|
14 |
+
# See the License for the specific language governing permissions and
|
15 |
+
|
16 |
+
""" Fine-tuning a 🤗 Transformers CTC model for automatic speech recognition"""
|
17 |
+
|
18 |
+
import functools
|
19 |
+
import json
|
20 |
+
import logging
|
21 |
+
import os
|
22 |
+
import re
|
23 |
+
import sys
|
24 |
+
import warnings
|
25 |
+
from dataclasses import dataclass, field
|
26 |
+
from typing import Dict, List, Optional, Union
|
27 |
+
|
28 |
+
import datasets
|
29 |
+
import numpy as np
|
30 |
+
import torch
|
31 |
+
from datasets import DatasetDict, load_dataset, load_metric
|
32 |
+
|
33 |
+
import transformers
|
34 |
+
from transformers import (
|
35 |
+
AutoConfig,
|
36 |
+
AutoFeatureExtractor,
|
37 |
+
AutoModelForCTC,
|
38 |
+
AutoProcessor,
|
39 |
+
AutoTokenizer,
|
40 |
+
HfArgumentParser,
|
41 |
+
Trainer,
|
42 |
+
TrainingArguments,
|
43 |
+
Wav2Vec2Processor,
|
44 |
+
set_seed,
|
45 |
+
)
|
46 |
+
from transformers.trainer_utils import get_last_checkpoint, is_main_process
|
47 |
+
from transformers.utils import check_min_version
|
48 |
+
from transformers.utils.versions import require_version
|
49 |
+
|
50 |
+
|
51 |
+
# Will error if the minimal version of Transformers is not installed. Remove at your own risks.
|
52 |
+
check_min_version("4.16.0.dev0")
|
53 |
+
|
54 |
+
require_version("datasets>=1.13.3", "To fix: pip install -r examples/pytorch/text-classification/requirements.txt")
|
55 |
+
|
56 |
+
|
57 |
+
logger = logging.getLogger(__name__)
|
58 |
+
|
59 |
+
|
60 |
+
def list_field(default=None, metadata=None):
|
61 |
+
return field(default_factory=lambda: default, metadata=metadata)
|
62 |
+
|
63 |
+
|
64 |
+
@dataclass
|
65 |
+
class ModelArguments:
|
66 |
+
"""
|
67 |
+
Arguments pertaining to which model/config/tokenizer we are going to fine-tune from.
|
68 |
+
"""
|
69 |
+
|
70 |
+
model_name_or_path: str = field(
|
71 |
+
metadata={"help": "Path to pretrained model or model identifier from huggingface.co/models"}
|
72 |
+
)
|
73 |
+
tokenizer_name_or_path: Optional[str] = field(
|
74 |
+
default=None,
|
75 |
+
metadata={"help": "Path to pretrained tokenizer or tokenizer identifier from huggingface.co/models"},
|
76 |
+
)
|
77 |
+
cache_dir: Optional[str] = field(
|
78 |
+
default=None,
|
79 |
+
metadata={"help": "Where do you want to store the pretrained models downloaded from huggingface.co"},
|
80 |
+
)
|
81 |
+
freeze_feature_encoder: bool = field(
|
82 |
+
default=True, metadata={"help": "Whether to freeze the feature encoder layers of the model."}
|
83 |
+
)
|
84 |
+
attention_dropout: float = field(
|
85 |
+
default=0.0, metadata={"help": "The dropout ratio for the attention probabilities."}
|
86 |
+
)
|
87 |
+
activation_dropout: float = field(
|
88 |
+
default=0.0, metadata={"help": "The dropout ratio for activations inside the fully connected layer."}
|
89 |
+
)
|
90 |
+
feat_proj_dropout: float = field(default=0.0, metadata={"help": "The dropout ratio for the projected features."})
|
91 |
+
hidden_dropout: float = field(
|
92 |
+
default=0.0,
|
93 |
+
metadata={
|
94 |
+
"help": "The dropout probability for all fully connected layers in the embeddings, encoder, and pooler."
|
95 |
+
},
|
96 |
+
)
|
97 |
+
final_dropout: float = field(
|
98 |
+
default=0.0,
|
99 |
+
metadata={"help": "The dropout probability for the final projection layer."},
|
100 |
+
)
|
101 |
+
mask_time_prob: float = field(
|
102 |
+
default=0.05,
|
103 |
+
metadata={
|
104 |
+
"help": "Probability of each feature vector along the time axis to be chosen as the start of the vector"
|
105 |
+
"span to be masked. Approximately ``mask_time_prob * sequence_length // mask_time_length`` feature"
|
106 |
+
"vectors will be masked along the time axis."
|
107 |
+
},
|
108 |
+
)
|
109 |
+
mask_time_length: int = field(
|
110 |
+
default=10,
|
111 |
+
metadata={"help": "Length of vector span to mask along the time axis."},
|
112 |
+
)
|
113 |
+
mask_feature_prob: float = field(
|
114 |
+
default=0.0,
|
115 |
+
metadata={
|
116 |
+
"help": "Probability of each feature vector along the feature axis to be chosen as the start of the vector"
|
117 |
+
"span to be masked. Approximately ``mask_feature_prob * sequence_length // mask_feature_length`` feature bins will be masked along the time axis."
|
118 |
+
},
|
119 |
+
)
|
120 |
+
mask_feature_length: int = field(
|
121 |
+
default=10,
|
122 |
+
metadata={"help": "Length of vector span to mask along the feature axis."},
|
123 |
+
)
|
124 |
+
layerdrop: float = field(default=0.0, metadata={"help": "The LayerDrop probability."})
|
125 |
+
ctc_loss_reduction: Optional[str] = field(
|
126 |
+
default="mean", metadata={"help": "The way the ctc loss should be reduced. Should be one of 'mean' or 'sum'."}
|
127 |
+
)
|
128 |
+
|
129 |
+
|
130 |
+
@dataclass
|
131 |
+
class DataTrainingArguments:
|
132 |
+
"""
|
133 |
+
Arguments pertaining to what data we are going to input our model for training and eval.
|
134 |
+
|
135 |
+
Using `HfArgumentParser` we can turn this class
|
136 |
+
into argparse arguments to be able to specify them on
|
137 |
+
the command line.
|
138 |
+
"""
|
139 |
+
|
140 |
+
dataset_name: str = field(
|
141 |
+
metadata={"help": "The configuration name of the dataset to use (via the datasets library)."}
|
142 |
+
)
|
143 |
+
dataset_config_name: str = field(
|
144 |
+
default=None, metadata={"help": "The configuration name of the dataset to use (via the datasets library)."}
|
145 |
+
)
|
146 |
+
train_split_name: str = field(
|
147 |
+
default="train+validation",
|
148 |
+
metadata={
|
149 |
+
"help": "The name of the training data set split to use (via the datasets library). Defaults to 'train'"
|
150 |
+
},
|
151 |
+
)
|
152 |
+
eval_split_name: str = field(
|
153 |
+
default="test",
|
154 |
+
metadata={
|
155 |
+
"help": "The name of the training data set split to use (via the datasets library). Defaults to 'test'"
|
156 |
+
},
|
157 |
+
)
|
158 |
+
audio_column_name: str = field(
|
159 |
+
default="audio",
|
160 |
+
metadata={"help": "The name of the dataset column containing the audio data. Defaults to 'audio'"},
|
161 |
+
)
|
162 |
+
text_column_name: str = field(
|
163 |
+
default="text",
|
164 |
+
metadata={"help": "The name of the dataset column containing the text data. Defaults to 'text'"},
|
165 |
+
)
|
166 |
+
overwrite_cache: bool = field(
|
167 |
+
default=False, metadata={"help": "Overwrite the cached preprocessed datasets or not."}
|
168 |
+
)
|
169 |
+
preprocessing_num_workers: Optional[int] = field(
|
170 |
+
default=None,
|
171 |
+
metadata={"help": "The number of processes to use for the preprocessing."},
|
172 |
+
)
|
173 |
+
max_train_samples: Optional[int] = field(
|
174 |
+
default=None,
|
175 |
+
metadata={
|
176 |
+
"help": "For debugging purposes or quicker training, truncate the number of training examples to this "
|
177 |
+
"value if set."
|
178 |
+
},
|
179 |
+
)
|
180 |
+
max_eval_samples: Optional[int] = field(
|
181 |
+
default=None,
|
182 |
+
metadata={
|
183 |
+
"help": "For debugging purposes or quicker training, truncate the number of validation examples to this "
|
184 |
+
"value if set."
|
185 |
+
},
|
186 |
+
)
|
187 |
+
chars_to_ignore: Optional[List[str]] = list_field(
|
188 |
+
default=None,
|
189 |
+
metadata={"help": "A list of characters to remove from the transcripts."},
|
190 |
+
)
|
191 |
+
eval_metrics: List[str] = list_field(
|
192 |
+
default=["wer"],
|
193 |
+
metadata={"help": "A list of metrics the model should be evaluated on. E.g. `'wer cer'`"},
|
194 |
+
)
|
195 |
+
max_duration_in_seconds: float = field(
|
196 |
+
default=20.0,
|
197 |
+
metadata={
|
198 |
+
"help": "Filter audio files that are longer than `max_duration_in_seconds` seconds to 'max_duration_in_seconds`"
|
199 |
+
},
|
200 |
+
)
|
201 |
+
min_duration_in_seconds: float = field(
|
202 |
+
default=0.0, metadata={"help": "Filter audio files that are shorter than `min_duration_in_seconds` seconds"}
|
203 |
+
)
|
204 |
+
preprocessing_only: bool = field(
|
205 |
+
default=False,
|
206 |
+
metadata={
|
207 |
+
"help": "Whether to only do data preprocessing and skip training. "
|
208 |
+
"This is especially useful when data preprocessing errors out in distributed training due to timeout. "
|
209 |
+
"In this case, one should run the preprocessing in a non-distributed setup with `preprocessing_only=True` "
|
210 |
+
"so that the cached datasets can consequently be loaded in distributed training"
|
211 |
+
},
|
212 |
+
)
|
213 |
+
use_auth_token: bool = field(
|
214 |
+
default=False,
|
215 |
+
metadata={
|
216 |
+
"help": "If :obj:`True`, will use the token generated when running"
|
217 |
+
":obj:`transformers-cli login` as HTTP bearer authorization for remote files."
|
218 |
+
},
|
219 |
+
)
|
220 |
+
unk_token: str = field(
|
221 |
+
default="[UNK]",
|
222 |
+
metadata={"help": "The unk token for the tokenizer"},
|
223 |
+
)
|
224 |
+
pad_token: str = field(
|
225 |
+
default="[PAD]",
|
226 |
+
metadata={"help": "The padding token for the tokenizer"},
|
227 |
+
)
|
228 |
+
word_delimiter_token: str = field(
|
229 |
+
default="|",
|
230 |
+
metadata={"help": "The word delimiter token for the tokenizer"},
|
231 |
+
)
|
232 |
+
phoneme_language: Optional[str] = field(
|
233 |
+
default=None,
|
234 |
+
metadata={
|
235 |
+
"help": "The target language that should be used be"
|
236 |
+
" passed to the tokenizer for tokenization. Note that"
|
237 |
+
" this is only relevant if the model classifies the"
|
238 |
+
" input audio to a sequence of phoneme sequences."
|
239 |
+
},
|
240 |
+
)
|
241 |
+
|
242 |
+
|
243 |
+
@dataclass
|
244 |
+
class DataCollatorCTCWithPadding:
|
245 |
+
"""
|
246 |
+
Data collator that will dynamically pad the inputs received.
|
247 |
+
Args:
|
248 |
+
processor (:class:`~transformers.AutoProcessor`)
|
249 |
+
The processor used for proccessing the data.
|
250 |
+
padding (:obj:`bool`, :obj:`str` or :class:`~transformers.tokenization_utils_base.PaddingStrategy`, `optional`, defaults to :obj:`True`):
|
251 |
+
Select a strategy to pad the returned sequences (according to the model's padding side and padding index)
|
252 |
+
among:
|
253 |
+
* :obj:`True` or :obj:`'longest'`: Pad to the longest sequence in the batch (or no padding if only a single
|
254 |
+
sequence if provided).
|
255 |
+
* :obj:`'max_length'`: Pad to a maximum length specified with the argument :obj:`max_length` or to the
|
256 |
+
maximum acceptable input length for the model if that argument is not provided.
|
257 |
+
* :obj:`False` or :obj:`'do_not_pad'` (default): No padding (i.e., can output a batch with sequences of
|
258 |
+
different lengths).
|
259 |
+
max_length (:obj:`int`, `optional`):
|
260 |
+
Maximum length of the ``input_values`` of the returned list and optionally padding length (see above).
|
261 |
+
max_length_labels (:obj:`int`, `optional`):
|
262 |
+
Maximum length of the ``labels`` returned list and optionally padding length (see above).
|
263 |
+
pad_to_multiple_of (:obj:`int`, `optional`):
|
264 |
+
If set will pad the sequence to a multiple of the provided value.
|
265 |
+
This is especially useful to enable the use of Tensor Cores on NVIDIA hardware with compute capability >=
|
266 |
+
7.5 (Volta).
|
267 |
+
"""
|
268 |
+
|
269 |
+
processor: AutoProcessor
|
270 |
+
padding: Union[bool, str] = "longest"
|
271 |
+
pad_to_multiple_of: Optional[int] = None
|
272 |
+
pad_to_multiple_of_labels: Optional[int] = None
|
273 |
+
|
274 |
+
def __call__(self, features: List[Dict[str, Union[List[int], torch.Tensor]]]) -> Dict[str, torch.Tensor]:
|
275 |
+
# split inputs and labels since they have to be of different lenghts and need
|
276 |
+
# different padding methods
|
277 |
+
input_features = [{"input_values": feature["input_values"]} for feature in features]
|
278 |
+
label_features = [{"input_ids": feature["labels"]} for feature in features]
|
279 |
+
|
280 |
+
batch = self.processor.pad(
|
281 |
+
input_features,
|
282 |
+
padding=self.padding,
|
283 |
+
pad_to_multiple_of=self.pad_to_multiple_of,
|
284 |
+
return_tensors="pt",
|
285 |
+
)
|
286 |
+
|
287 |
+
with self.processor.as_target_processor():
|
288 |
+
labels_batch = self.processor.pad(
|
289 |
+
label_features,
|
290 |
+
padding=self.padding,
|
291 |
+
pad_to_multiple_of=self.pad_to_multiple_of_labels,
|
292 |
+
return_tensors="pt",
|
293 |
+
)
|
294 |
+
|
295 |
+
# replace padding with -100 to ignore loss correctly
|
296 |
+
labels = labels_batch["input_ids"].masked_fill(labels_batch.attention_mask.ne(1), -100)
|
297 |
+
|
298 |
+
batch["labels"] = labels
|
299 |
+
|
300 |
+
return batch
|
301 |
+
|
302 |
+
|
303 |
+
def create_vocabulary_from_data(
|
304 |
+
datasets: DatasetDict,
|
305 |
+
word_delimiter_token: Optional[str] = None,
|
306 |
+
unk_token: Optional[str] = None,
|
307 |
+
pad_token: Optional[str] = None,
|
308 |
+
):
|
309 |
+
# Given training and test labels create vocabulary
|
310 |
+
def extract_all_chars(batch):
|
311 |
+
all_text = " ".join(batch["target_text"])
|
312 |
+
vocab = list(set(all_text))
|
313 |
+
return {"vocab": [vocab], "all_text": [all_text]}
|
314 |
+
|
315 |
+
vocabs = datasets.map(
|
316 |
+
extract_all_chars,
|
317 |
+
batched=True,
|
318 |
+
batch_size=-1,
|
319 |
+
keep_in_memory=True,
|
320 |
+
remove_columns=datasets["train"].column_names,
|
321 |
+
)
|
322 |
+
|
323 |
+
# take union of all unique characters in each dataset
|
324 |
+
vocab_set = functools.reduce(
|
325 |
+
lambda vocab_1, vocab_2: set(vocab_1["vocab"][0]) | set(vocab_2["vocab"][0]), vocabs.values()
|
326 |
+
)
|
327 |
+
|
328 |
+
vocab_dict = {v: k for k, v in enumerate(sorted(list(vocab_set)))}
|
329 |
+
|
330 |
+
# replace white space with delimiter token
|
331 |
+
if word_delimiter_token is not None:
|
332 |
+
vocab_dict[word_delimiter_token] = vocab_dict[" "]
|
333 |
+
del vocab_dict[" "]
|
334 |
+
|
335 |
+
# add unk and pad token
|
336 |
+
if unk_token is not None:
|
337 |
+
vocab_dict[unk_token] = len(vocab_dict)
|
338 |
+
|
339 |
+
if pad_token is not None:
|
340 |
+
vocab_dict[pad_token] = len(vocab_dict)
|
341 |
+
|
342 |
+
return vocab_dict
|
343 |
+
|
344 |
+
|
345 |
+
def main():
|
346 |
+
# See all possible arguments in src/transformers/training_args.py
|
347 |
+
# or by passing the --help flag to this script.
|
348 |
+
# We now keep distinct sets of args, for a cleaner separation of concerns.
|
349 |
+
|
350 |
+
parser = HfArgumentParser((ModelArguments, DataTrainingArguments, TrainingArguments))
|
351 |
+
if len(sys.argv) == 2 and sys.argv[1].endswith(".json"):
|
352 |
+
# If we pass only one argument to the script and it's the path to a json file,
|
353 |
+
# let's parse it to get our arguments.
|
354 |
+
model_args, data_args, training_args = parser.parse_json_file(json_file=os.path.abspath(sys.argv[1]))
|
355 |
+
else:
|
356 |
+
model_args, data_args, training_args = parser.parse_args_into_dataclasses()
|
357 |
+
|
358 |
+
# Detecting last checkpoint.
|
359 |
+
last_checkpoint = None
|
360 |
+
if os.path.isdir(training_args.output_dir) and training_args.do_train and not training_args.overwrite_output_dir:
|
361 |
+
last_checkpoint = get_last_checkpoint(training_args.output_dir)
|
362 |
+
if last_checkpoint is None and len(os.listdir(training_args.output_dir)) > 0:
|
363 |
+
raise ValueError(
|
364 |
+
f"Output directory ({training_args.output_dir}) already exists and is not empty. "
|
365 |
+
"Use --overwrite_output_dir to overcome."
|
366 |
+
)
|
367 |
+
elif last_checkpoint is not None:
|
368 |
+
logger.info(
|
369 |
+
f"Checkpoint detected, resuming training at {last_checkpoint}. To avoid this behavior, change "
|
370 |
+
"the `--output_dir` or add `--overwrite_output_dir` to train from scratch."
|
371 |
+
)
|
372 |
+
|
373 |
+
# Setup logging
|
374 |
+
logging.basicConfig(
|
375 |
+
format="%(asctime)s - %(levelname)s - %(name)s - %(message)s",
|
376 |
+
datefmt="%m/%d/%Y %H:%M:%S",
|
377 |
+
handlers=[logging.StreamHandler(sys.stdout)],
|
378 |
+
)
|
379 |
+
logger.setLevel(logging.INFO if is_main_process(training_args.local_rank) else logging.WARN)
|
380 |
+
|
381 |
+
# Log on each process the small summary:
|
382 |
+
logger.warning(
|
383 |
+
f"Process rank: {training_args.local_rank}, device: {training_args.device}, n_gpu: {training_args.n_gpu}"
|
384 |
+
f"distributed training: {bool(training_args.local_rank != -1)}, 16-bits training: {training_args.fp16}"
|
385 |
+
)
|
386 |
+
# Set the verbosity to info of the Transformers logger (on main process only):
|
387 |
+
if is_main_process(training_args.local_rank):
|
388 |
+
transformers.utils.logging.set_verbosity_info()
|
389 |
+
logger.info("Training/evaluation parameters %s", training_args)
|
390 |
+
|
391 |
+
# Set seed before initializing model.
|
392 |
+
set_seed(training_args.seed)
|
393 |
+
|
394 |
+
# 1. First, let's load the dataset
|
395 |
+
raw_datasets = DatasetDict()
|
396 |
+
|
397 |
+
if training_args.do_train:
|
398 |
+
raw_datasets["train"] = load_dataset(
|
399 |
+
data_args.dataset_name,
|
400 |
+
data_args.dataset_config_name,
|
401 |
+
split=data_args.train_split_name,
|
402 |
+
use_auth_token=data_args.use_auth_token,
|
403 |
+
)
|
404 |
+
|
405 |
+
if data_args.audio_column_name not in raw_datasets["train"].column_names:
|
406 |
+
raise ValueError(
|
407 |
+
f"--audio_column_name '{data_args.audio_column_name}' not found in dataset '{data_args.dataset_name}'. "
|
408 |
+
"Make sure to set `--audio_column_name` to the correct audio column - one of "
|
409 |
+
f"{', '.join(raw_datasets['train'].column_names)}."
|
410 |
+
)
|
411 |
+
|
412 |
+
if data_args.text_column_name not in raw_datasets["train"].column_names:
|
413 |
+
raise ValueError(
|
414 |
+
f"--text_column_name {data_args.text_column_name} not found in dataset '{data_args.dataset_name}'. "
|
415 |
+
"Make sure to set `--text_column_name` to the correct text column - one of "
|
416 |
+
f"{', '.join(raw_datasets['train'].column_names)}."
|
417 |
+
)
|
418 |
+
|
419 |
+
if data_args.max_train_samples is not None:
|
420 |
+
raw_datasets["train"] = raw_datasets["train"].select(range(data_args.max_train_samples))
|
421 |
+
|
422 |
+
if training_args.do_eval:
|
423 |
+
raw_datasets["eval"] = load_dataset(
|
424 |
+
data_args.dataset_name,
|
425 |
+
data_args.dataset_config_name,
|
426 |
+
split=data_args.eval_split_name,
|
427 |
+
use_auth_token=data_args.use_auth_token,
|
428 |
+
)
|
429 |
+
|
430 |
+
if data_args.max_eval_samples is not None:
|
431 |
+
raw_datasets["eval"] = raw_datasets["eval"].select(range(data_args.max_eval_samples))
|
432 |
+
|
433 |
+
# 2. We remove some special characters from the datasets
|
434 |
+
# that make training complicated and do not help in transcribing the speech
|
435 |
+
# E.g. characters, such as `,` and `.` do not really have an acoustic characteristic
|
436 |
+
# that could be easily picked up by the model
|
437 |
+
chars_to_ignore_regex = (
|
438 |
+
f'[{"".join(data_args.chars_to_ignore)}]' if data_args.chars_to_ignore is not None else None
|
439 |
+
)
|
440 |
+
text_column_name = data_args.text_column_name
|
441 |
+
|
442 |
+
def remove_special_characters(batch):
|
443 |
+
if chars_to_ignore_regex is not None:
|
444 |
+
batch["target_text"] = re.sub(chars_to_ignore_regex, "", batch[text_column_name]).lower() + " "
|
445 |
+
else:
|
446 |
+
batch["target_text"] = batch[text_column_name].lower() + " "
|
447 |
+
return batch
|
448 |
+
|
449 |
+
with training_args.main_process_first(desc="dataset map special characters removal"):
|
450 |
+
raw_datasets = raw_datasets.map(
|
451 |
+
remove_special_characters,
|
452 |
+
remove_columns=[text_column_name],
|
453 |
+
desc="remove special characters from datasets",
|
454 |
+
)
|
455 |
+
|
456 |
+
# save special tokens for tokenizer
|
457 |
+
word_delimiter_token = data_args.word_delimiter_token
|
458 |
+
unk_token = data_args.unk_token
|
459 |
+
pad_token = data_args.pad_token
|
460 |
+
|
461 |
+
# 3. Next, let's load the config as we might need it to create
|
462 |
+
# the tokenizer
|
463 |
+
# load config
|
464 |
+
config = AutoConfig.from_pretrained(
|
465 |
+
model_args.model_name_or_path, cache_dir=model_args.cache_dir, use_auth_token=data_args.use_auth_token
|
466 |
+
)
|
467 |
+
|
468 |
+
# 4. Next, if no tokenizer file is defined,
|
469 |
+
# we create the vocabulary of the model by extracting all unique characters from
|
470 |
+
# the training and evaluation datasets
|
471 |
+
# We need to make sure that only first rank saves vocabulary
|
472 |
+
# make sure all processes wait until vocab is created
|
473 |
+
tokenizer_name_or_path = model_args.tokenizer_name_or_path
|
474 |
+
tokenizer_kwargs = {}
|
475 |
+
if tokenizer_name_or_path is None:
|
476 |
+
# save vocab in training output dir
|
477 |
+
tokenizer_name_or_path = training_args.output_dir
|
478 |
+
|
479 |
+
vocab_file = os.path.join(tokenizer_name_or_path, "vocab.json")
|
480 |
+
|
481 |
+
with training_args.main_process_first():
|
482 |
+
if training_args.overwrite_output_dir and os.path.isfile(vocab_file):
|
483 |
+
os.remove(vocab_file)
|
484 |
+
|
485 |
+
with training_args.main_process_first(desc="dataset map vocabulary creation"):
|
486 |
+
if not os.path.isfile(vocab_file):
|
487 |
+
os.makedirs(tokenizer_name_or_path, exist_ok=True)
|
488 |
+
vocab_dict = create_vocabulary_from_data(
|
489 |
+
raw_datasets,
|
490 |
+
word_delimiter_token=word_delimiter_token,
|
491 |
+
unk_token=unk_token,
|
492 |
+
pad_token=pad_token,
|
493 |
+
)
|
494 |
+
|
495 |
+
# save vocab dict to be loaded into tokenizer
|
496 |
+
with open(vocab_file, "w") as file:
|
497 |
+
json.dump(vocab_dict, file)
|
498 |
+
|
499 |
+
# if tokenizer has just been created
|
500 |
+
# it is defined by `tokenizer_class` if present in config else by `model_type`
|
501 |
+
tokenizer_kwargs = {
|
502 |
+
"config": config if config.tokenizer_class is not None else None,
|
503 |
+
"tokenizer_type": config.model_type if config.tokenizer_class is None else None,
|
504 |
+
"unk_token": unk_token,
|
505 |
+
"pad_token": pad_token,
|
506 |
+
"word_delimiter_token": word_delimiter_token,
|
507 |
+
}
|
508 |
+
|
509 |
+
# 5. Now we can instantiate the feature extractor, tokenizer and model
|
510 |
+
# Note for distributed training, the .from_pretrained methods guarantee that only
|
511 |
+
# one local process can concurrently download model & vocab.
|
512 |
+
|
513 |
+
# load feature_extractor and tokenizer
|
514 |
+
tokenizer = AutoTokenizer.from_pretrained(
|
515 |
+
tokenizer_name_or_path,
|
516 |
+
use_auth_token=data_args.use_auth_token,
|
517 |
+
**tokenizer_kwargs,
|
518 |
+
)
|
519 |
+
feature_extractor = AutoFeatureExtractor.from_pretrained(
|
520 |
+
model_args.model_name_or_path, cache_dir=model_args.cache_dir, use_auth_token=data_args.use_auth_token
|
521 |
+
)
|
522 |
+
|
523 |
+
# adapt config
|
524 |
+
config.update(
|
525 |
+
{
|
526 |
+
"feat_proj_dropout": model_args.feat_proj_dropout,
|
527 |
+
"attention_dropout": model_args.attention_dropout,
|
528 |
+
"hidden_dropout": model_args.hidden_dropout,
|
529 |
+
"final_dropout": model_args.final_dropout,
|
530 |
+
"mask_time_prob": model_args.mask_time_prob,
|
531 |
+
"mask_time_length": model_args.mask_time_length,
|
532 |
+
"mask_feature_prob": model_args.mask_feature_prob,
|
533 |
+
"mask_feature_length": model_args.mask_feature_length,
|
534 |
+
"gradient_checkpointing": training_args.gradient_checkpointing,
|
535 |
+
"layerdrop": model_args.layerdrop,
|
536 |
+
"ctc_loss_reduction": model_args.ctc_loss_reduction,
|
537 |
+
"pad_token_id": tokenizer.pad_token_id,
|
538 |
+
"vocab_size": len(tokenizer),
|
539 |
+
"activation_dropout": model_args.activation_dropout,
|
540 |
+
}
|
541 |
+
)
|
542 |
+
|
543 |
+
# create model
|
544 |
+
model = AutoModelForCTC.from_pretrained(
|
545 |
+
model_args.model_name_or_path,
|
546 |
+
cache_dir=model_args.cache_dir,
|
547 |
+
config=config,
|
548 |
+
use_auth_token=data_args.use_auth_token,
|
549 |
+
)
|
550 |
+
|
551 |
+
#model.lm_head = torch.nn.Linear(config.output_hidden_size, config.vocab_size)
|
552 |
+
|
553 |
+
# freeze encoder
|
554 |
+
if model_args.freeze_feature_encoder:
|
555 |
+
model.freeze_feature_encoder()
|
556 |
+
for layer in range(23):
|
557 |
+
for param in model.wav2vec2.encoder.layers[layer].parameters():
|
558 |
+
param.requires_grad = False
|
559 |
+
|
560 |
+
# 6. Now we preprocess the datasets including loading the audio, resampling and normalization
|
561 |
+
# Thankfully, `datasets` takes care of automatically loading and resampling the audio,
|
562 |
+
# so that we just need to set the correct target sampling rate and normalize the input
|
563 |
+
# via the `feature_extractor`
|
564 |
+
|
565 |
+
# make sure that dataset decodes audio with correct sampling rate
|
566 |
+
dataset_sampling_rate = next(iter(raw_datasets.values())).features[data_args.audio_column_name].sampling_rate
|
567 |
+
if dataset_sampling_rate != feature_extractor.sampling_rate:
|
568 |
+
raw_datasets = raw_datasets.cast_column(
|
569 |
+
data_args.audio_column_name, datasets.features.Audio(sampling_rate=feature_extractor.sampling_rate)
|
570 |
+
)
|
571 |
+
|
572 |
+
# derive max & min input length for sample rate & max duration
|
573 |
+
max_input_length = data_args.max_duration_in_seconds * feature_extractor.sampling_rate
|
574 |
+
min_input_length = data_args.min_duration_in_seconds * feature_extractor.sampling_rate
|
575 |
+
audio_column_name = data_args.audio_column_name
|
576 |
+
num_workers = data_args.preprocessing_num_workers
|
577 |
+
|
578 |
+
# `phoneme_language` is only relevant if the model is fine-tuned on phoneme classification
|
579 |
+
phoneme_language = data_args.phoneme_language
|
580 |
+
|
581 |
+
# Preprocessing the datasets.
|
582 |
+
# We need to read the audio files as arrays and tokenize the targets.
|
583 |
+
def prepare_dataset(batch):
|
584 |
+
# load audio
|
585 |
+
sample = batch[audio_column_name]
|
586 |
+
|
587 |
+
inputs = feature_extractor(sample["array"], sampling_rate=sample["sampling_rate"])
|
588 |
+
batch["input_values"] = inputs.input_values[0]
|
589 |
+
batch["input_length"] = len(batch["input_values"])
|
590 |
+
|
591 |
+
# encode targets
|
592 |
+
additional_kwargs = {}
|
593 |
+
if phoneme_language is not None:
|
594 |
+
additional_kwargs["phonemizer_lang"] = phoneme_language
|
595 |
+
|
596 |
+
batch["labels"] = tokenizer(batch["target_text"], **additional_kwargs).input_ids
|
597 |
+
return batch
|
598 |
+
|
599 |
+
with training_args.main_process_first(desc="dataset map preprocessing"):
|
600 |
+
vectorized_datasets = raw_datasets.map(
|
601 |
+
prepare_dataset,
|
602 |
+
remove_columns=next(iter(raw_datasets.values())).column_names,
|
603 |
+
num_proc=num_workers,
|
604 |
+
desc="preprocess datasets",
|
605 |
+
)
|
606 |
+
|
607 |
+
def is_audio_in_length_range(length):
|
608 |
+
return length > min_input_length and length < max_input_length
|
609 |
+
|
610 |
+
# filter data that is shorter than min_input_length
|
611 |
+
vectorized_datasets = vectorized_datasets.filter(
|
612 |
+
is_audio_in_length_range,
|
613 |
+
num_proc=num_workers,
|
614 |
+
input_columns=["input_length"],
|
615 |
+
)
|
616 |
+
|
617 |
+
# 7. Next, we can prepare the training.
|
618 |
+
# Let's use word error rate (WER) as our evaluation metric,
|
619 |
+
# instantiate a data collator and the trainer
|
620 |
+
|
621 |
+
# Define evaluation metrics during training, *i.e.* word error rate, character error rate
|
622 |
+
eval_metrics = {metric: load_metric(metric) for metric in data_args.eval_metrics}
|
623 |
+
|
624 |
+
# for large datasets it is advised to run the preprocessing on a
|
625 |
+
# single machine first with ``args.preprocessing_only`` since there will mostly likely
|
626 |
+
# be a timeout when running the script in distributed mode.
|
627 |
+
# In a second step ``args.preprocessing_only`` can then be set to `False` to load the
|
628 |
+
# cached dataset
|
629 |
+
if data_args.preprocessing_only:
|
630 |
+
logger.info(f"Data preprocessing finished. Files cached at {vectorized_datasets.cache_files}")
|
631 |
+
return
|
632 |
+
|
633 |
+
def compute_metrics(pred):
|
634 |
+
pred_logits = pred.predictions
|
635 |
+
pred_ids = np.argmax(pred_logits, axis=-1)
|
636 |
+
|
637 |
+
pred.label_ids[pred.label_ids == -100] = tokenizer.pad_token_id
|
638 |
+
|
639 |
+
pred_str = tokenizer.batch_decode(pred_ids)
|
640 |
+
# we do not want to group tokens when computing the metrics
|
641 |
+
label_str = tokenizer.batch_decode(pred.label_ids, group_tokens=False)
|
642 |
+
|
643 |
+
metrics = {k: v.compute(predictions=pred_str, references=label_str) for k, v in eval_metrics.items()}
|
644 |
+
|
645 |
+
return metrics
|
646 |
+
|
647 |
+
# Now save everything to be able to create a single processor later
|
648 |
+
if is_main_process(training_args.local_rank):
|
649 |
+
# save feature extractor, tokenizer and config
|
650 |
+
feature_extractor.save_pretrained(training_args.output_dir)
|
651 |
+
tokenizer.save_pretrained(training_args.output_dir)
|
652 |
+
config.save_pretrained(training_args.output_dir)
|
653 |
+
|
654 |
+
try:
|
655 |
+
processor = AutoProcessor.from_pretrained(training_args.output_dir)
|
656 |
+
except (OSError, KeyError):
|
657 |
+
warnings.warn(
|
658 |
+
"Loading a processor from a feature extractor config that does not"
|
659 |
+
" include a `processor_class` attribute is deprecated and will be removed in v5. Please add the following "
|
660 |
+
" attribute to your `preprocessor_config.json` file to suppress this warning: "
|
661 |
+
" `'processor_class': 'Wav2Vec2Processor'`",
|
662 |
+
FutureWarning,
|
663 |
+
)
|
664 |
+
processor = Wav2Vec2Processor.from_pretrained(training_args.output_dir)
|
665 |
+
|
666 |
+
# Instantiate custom data collator
|
667 |
+
data_collator = DataCollatorCTCWithPadding(processor=processor)
|
668 |
+
|
669 |
+
# Initialize Trainer
|
670 |
+
trainer = Trainer(
|
671 |
+
model=model,
|
672 |
+
data_collator=data_collator,
|
673 |
+
args=training_args,
|
674 |
+
compute_metrics=compute_metrics,
|
675 |
+
train_dataset=vectorized_datasets["train"] if training_args.do_train else None,
|
676 |
+
eval_dataset=vectorized_datasets["eval"] if training_args.do_eval else None,
|
677 |
+
tokenizer=feature_extractor,
|
678 |
+
)
|
679 |
+
|
680 |
+
# 8. Finally, we can start training
|
681 |
+
|
682 |
+
# Training
|
683 |
+
if training_args.do_train:
|
684 |
+
|
685 |
+
# use last checkpoint if exist
|
686 |
+
if last_checkpoint is not None:
|
687 |
+
checkpoint = last_checkpoint
|
688 |
+
elif os.path.isdir(model_args.model_name_or_path):
|
689 |
+
checkpoint = model_args.model_name_or_path
|
690 |
+
else:
|
691 |
+
checkpoint = None
|
692 |
+
|
693 |
+
train_result = trainer.train(resume_from_checkpoint=checkpoint)
|
694 |
+
trainer.save_model()
|
695 |
+
|
696 |
+
metrics = train_result.metrics
|
697 |
+
max_train_samples = (
|
698 |
+
data_args.max_train_samples
|
699 |
+
if data_args.max_train_samples is not None
|
700 |
+
else len(vectorized_datasets["train"])
|
701 |
+
)
|
702 |
+
metrics["train_samples"] = min(max_train_samples, len(vectorized_datasets["train"]))
|
703 |
+
|
704 |
+
trainer.log_metrics("train", metrics)
|
705 |
+
trainer.save_metrics("train", metrics)
|
706 |
+
trainer.save_state()
|
707 |
+
|
708 |
+
# Evaluation
|
709 |
+
results = {}
|
710 |
+
if training_args.do_eval:
|
711 |
+
logger.info("*** Evaluate ***")
|
712 |
+
metrics = trainer.evaluate()
|
713 |
+
max_eval_samples = (
|
714 |
+
data_args.max_eval_samples if data_args.max_eval_samples is not None else len(vectorized_datasets["eval"])
|
715 |
+
)
|
716 |
+
metrics["eval_samples"] = min(max_eval_samples, len(vectorized_datasets["eval"]))
|
717 |
+
|
718 |
+
trainer.log_metrics("eval", metrics)
|
719 |
+
trainer.save_metrics("eval", metrics)
|
720 |
+
|
721 |
+
# Write model card and (optionally) push to hub
|
722 |
+
config_name = data_args.dataset_config_name if data_args.dataset_config_name is not None else "na"
|
723 |
+
kwargs = {
|
724 |
+
"finetuned_from": model_args.model_name_or_path,
|
725 |
+
"tasks": "speech-recognition",
|
726 |
+
"tags": ["automatic-speech-recognition", data_args.dataset_name],
|
727 |
+
"dataset_args": f"Config: {config_name}, Training split: {data_args.train_split_name}, Eval split: {data_args.eval_split_name}",
|
728 |
+
"dataset": f"{data_args.dataset_name.upper()} - {config_name.upper()}",
|
729 |
+
}
|
730 |
+
if "common_voice" in data_args.dataset_name:
|
731 |
+
kwargs["language"] = config_name
|
732 |
+
|
733 |
+
if training_args.push_to_hub:
|
734 |
+
trainer.push_to_hub(**kwargs)
|
735 |
+
else:
|
736 |
+
trainer.create_model_card(**kwargs)
|
737 |
+
|
738 |
+
return results
|
739 |
+
|
740 |
+
|
741 |
+
if __name__ == "__main__":
|
742 |
+
main()
|
run_speech_recognition_ctc_for_cgn.py
ADDED
@@ -0,0 +1,766 @@
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
1 |
+
#!/usr/bin/env python
|
2 |
+
# coding=utf-8
|
3 |
+
# Copyright 2021 The HuggingFace Inc. team. All rights reserved.
|
4 |
+
#
|
5 |
+
# Licensed under the Apache License, Version 2.0 (the "License");
|
6 |
+
# you may not use this file except in compliance with the License.
|
7 |
+
# You may obtain a copy of the License at
|
8 |
+
#
|
9 |
+
# http://www.apache.org/licenses/LICENSE-2.0
|
10 |
+
#
|
11 |
+
# Unless required by applicable law or agreed to in writing, software
|
12 |
+
# distributed under the License is distributed on an "AS IS" BASIS,
|
13 |
+
# WITHOUT WARRANTIES OR CONDITIONS OF ANY KIND, either express or implied.
|
14 |
+
# See the License for the specific language governing permissions and
|
15 |
+
|
16 |
+
""" Fine-tuning a 🤗 Transformers CTC model for automatic speech recognition"""
|
17 |
+
|
18 |
+
import functools
|
19 |
+
import json
|
20 |
+
import logging
|
21 |
+
import os
|
22 |
+
import re
|
23 |
+
import sys
|
24 |
+
import warnings
|
25 |
+
from dataclasses import dataclass, field
|
26 |
+
from typing import Dict, List, Optional, Union
|
27 |
+
|
28 |
+
import datasets
|
29 |
+
import numpy as np
|
30 |
+
import torch
|
31 |
+
from datasets import DatasetDict, load_dataset, load_from_disk, load_metric
|
32 |
+
|
33 |
+
import transformers
|
34 |
+
from transformers import (
|
35 |
+
AutoConfig,
|
36 |
+
AutoFeatureExtractor,
|
37 |
+
AutoModelForCTC,
|
38 |
+
AutoProcessor,
|
39 |
+
AutoTokenizer,
|
40 |
+
HfArgumentParser,
|
41 |
+
Trainer,
|
42 |
+
TrainingArguments,
|
43 |
+
Wav2Vec2Processor,
|
44 |
+
set_seed,
|
45 |
+
)
|
46 |
+
from transformers.trainer_utils import get_last_checkpoint, is_main_process
|
47 |
+
from transformers.utils import check_min_version
|
48 |
+
from transformers.utils.versions import require_version
|
49 |
+
|
50 |
+
|
51 |
+
# Will error if the minimal version of Transformers is not installed. Remove at your own risks.
|
52 |
+
check_min_version("4.16.0.dev0")
|
53 |
+
|
54 |
+
require_version("datasets>=1.13.3", "To fix: pip install -r examples/pytorch/text-classification/requirements.txt")
|
55 |
+
|
56 |
+
|
57 |
+
logger = logging.getLogger(__name__)
|
58 |
+
|
59 |
+
|
60 |
+
def list_field(default=None, metadata=None):
|
61 |
+
return field(default_factory=lambda: default, metadata=metadata)
|
62 |
+
|
63 |
+
|
64 |
+
@dataclass
|
65 |
+
class ModelArguments:
|
66 |
+
"""
|
67 |
+
Arguments pertaining to which model/config/tokenizer we are going to fine-tune from.
|
68 |
+
"""
|
69 |
+
|
70 |
+
model_name_or_path: str = field(
|
71 |
+
metadata={"help": "Path to pretrained model or model identifier from huggingface.co/models"}
|
72 |
+
)
|
73 |
+
tokenizer_name_or_path: Optional[str] = field(
|
74 |
+
default=None,
|
75 |
+
metadata={"help": "Path to pretrained tokenizer or tokenizer identifier from huggingface.co/models"},
|
76 |
+
)
|
77 |
+
cache_dir: Optional[str] = field(
|
78 |
+
default=None,
|
79 |
+
metadata={"help": "Where do you want to store the pretrained models downloaded from huggingface.co"},
|
80 |
+
)
|
81 |
+
freeze_feature_encoder: bool = field(
|
82 |
+
default=True, metadata={"help": "Whether to freeze the feature encoder layers of the model."}
|
83 |
+
)
|
84 |
+
attention_dropout: float = field(
|
85 |
+
default=0.0, metadata={"help": "The dropout ratio for the attention probabilities."}
|
86 |
+
)
|
87 |
+
activation_dropout: float = field(
|
88 |
+
default=0.0, metadata={"help": "The dropout ratio for activations inside the fully connected layer."}
|
89 |
+
)
|
90 |
+
feat_proj_dropout: float = field(default=0.0, metadata={"help": "The dropout ratio for the projected features."})
|
91 |
+
hidden_dropout: float = field(
|
92 |
+
default=0.0,
|
93 |
+
metadata={
|
94 |
+
"help": "The dropout probability for all fully connected layers in the embeddings, encoder, and pooler."
|
95 |
+
},
|
96 |
+
)
|
97 |
+
final_dropout: float = field(
|
98 |
+
default=0.0,
|
99 |
+
metadata={"help": "The dropout probability for the final projection layer."},
|
100 |
+
)
|
101 |
+
mask_time_prob: float = field(
|
102 |
+
default=0.05,
|
103 |
+
metadata={
|
104 |
+
"help": "Probability of each feature vector along the time axis to be chosen as the start of the vector"
|
105 |
+
"span to be masked. Approximately ``mask_time_prob * sequence_length // mask_time_length`` feature"
|
106 |
+
"vectors will be masked along the time axis."
|
107 |
+
},
|
108 |
+
)
|
109 |
+
mask_time_length: int = field(
|
110 |
+
default=10,
|
111 |
+
metadata={"help": "Length of vector span to mask along the time axis."},
|
112 |
+
)
|
113 |
+
mask_feature_prob: float = field(
|
114 |
+
default=0.0,
|
115 |
+
metadata={
|
116 |
+
"help": "Probability of each feature vector along the feature axis to be chosen as the start of the vector"
|
117 |
+
"span to be masked. Approximately ``mask_feature_prob * sequence_length // mask_feature_length`` feature bins will be masked along the time axis."
|
118 |
+
},
|
119 |
+
)
|
120 |
+
mask_feature_length: int = field(
|
121 |
+
default=10,
|
122 |
+
metadata={"help": "Length of vector span to mask along the feature axis."},
|
123 |
+
)
|
124 |
+
layerdrop: float = field(default=0.0, metadata={"help": "The LayerDrop probability."})
|
125 |
+
ctc_loss_reduction: Optional[str] = field(
|
126 |
+
default="mean", metadata={"help": "The way the ctc loss should be reduced. Should be one of 'mean' or 'sum'."}
|
127 |
+
)
|
128 |
+
|
129 |
+
|
130 |
+
@dataclass
|
131 |
+
class DataTrainingArguments:
|
132 |
+
"""
|
133 |
+
Arguments pertaining to what data we are going to input our model for training and eval.
|
134 |
+
|
135 |
+
Using `HfArgumentParser` we can turn this class
|
136 |
+
into argparse arguments to be able to specify them on
|
137 |
+
the command line.
|
138 |
+
"""
|
139 |
+
|
140 |
+
dataset_name: str = field(
|
141 |
+
metadata={"help": "The configuration name of the dataset to use (via the datasets library)."}
|
142 |
+
)
|
143 |
+
dataset_config_name: str = field(
|
144 |
+
default=None, metadata={"help": "The configuration name of the dataset to use (via the datasets library)."}
|
145 |
+
)
|
146 |
+
train_split_name: str = field(
|
147 |
+
default="train+validation",
|
148 |
+
metadata={
|
149 |
+
"help": "The name of the training data set split to use (via the datasets library). Defaults to 'train'"
|
150 |
+
},
|
151 |
+
)
|
152 |
+
eval_split_name: str = field(
|
153 |
+
default="test",
|
154 |
+
metadata={
|
155 |
+
"help": "The name of the training data set split to use (via the datasets library). Defaults to 'test'"
|
156 |
+
},
|
157 |
+
)
|
158 |
+
audio_column_name: str = field(
|
159 |
+
default="audio",
|
160 |
+
metadata={"help": "The name of the dataset column containing the audio data. Defaults to 'audio'"},
|
161 |
+
)
|
162 |
+
text_column_name: str = field(
|
163 |
+
default="text",
|
164 |
+
metadata={"help": "The name of the dataset column containing the text data. Defaults to 'text'"},
|
165 |
+
)
|
166 |
+
overwrite_cache: bool = field(
|
167 |
+
default=False, metadata={"help": "Overwrite the cached preprocessed datasets or not."}
|
168 |
+
)
|
169 |
+
preprocessing_num_workers: Optional[int] = field(
|
170 |
+
default=None,
|
171 |
+
metadata={"help": "The number of processes to use for the preprocessing."},
|
172 |
+
)
|
173 |
+
max_train_samples: Optional[int] = field(
|
174 |
+
default=None,
|
175 |
+
metadata={
|
176 |
+
"help": "For debugging purposes or quicker training, truncate the number of training examples to this "
|
177 |
+
"value if set."
|
178 |
+
},
|
179 |
+
)
|
180 |
+
max_eval_samples: Optional[int] = field(
|
181 |
+
default=None,
|
182 |
+
metadata={
|
183 |
+
"help": "For debugging purposes or quicker training, truncate the number of validation examples to this "
|
184 |
+
"value if set."
|
185 |
+
},
|
186 |
+
)
|
187 |
+
chars_to_ignore: Optional[List[str]] = list_field(
|
188 |
+
default=None,
|
189 |
+
metadata={"help": "A list of characters to remove from the transcripts."},
|
190 |
+
)
|
191 |
+
eval_metrics: List[str] = list_field(
|
192 |
+
default=["wer"],
|
193 |
+
metadata={"help": "A list of metrics the model should be evaluated on. E.g. `'wer cer'`"},
|
194 |
+
)
|
195 |
+
max_duration_in_seconds: float = field(
|
196 |
+
default=20.0,
|
197 |
+
metadata={
|
198 |
+
"help": "Filter audio files that are longer than `max_duration_in_seconds` seconds to 'max_duration_in_seconds`"
|
199 |
+
},
|
200 |
+
)
|
201 |
+
min_duration_in_seconds: float = field(
|
202 |
+
default=0.0, metadata={"help": "Filter audio files that are shorter than `min_duration_in_seconds` seconds"}
|
203 |
+
)
|
204 |
+
preprocessing_only: bool = field(
|
205 |
+
default=False,
|
206 |
+
metadata={
|
207 |
+
"help": "Whether to only do data preprocessing and skip training. "
|
208 |
+
"This is especially useful when data preprocessing errors out in distributed training due to timeout. "
|
209 |
+
"In this case, one should run the preprocessing in a non-distributed setup with `preprocessing_only=True` "
|
210 |
+
"so that the cached datasets can consequently be loaded in distributed training"
|
211 |
+
},
|
212 |
+
)
|
213 |
+
use_auth_token: bool = field(
|
214 |
+
default=False,
|
215 |
+
metadata={
|
216 |
+
"help": "If :obj:`True`, will use the token generated when running"
|
217 |
+
":obj:`transformers-cli login` as HTTP bearer authorization for remote files."
|
218 |
+
},
|
219 |
+
)
|
220 |
+
unk_token: str = field(
|
221 |
+
default="[UNK]",
|
222 |
+
metadata={"help": "The unk token for the tokenizer"},
|
223 |
+
)
|
224 |
+
pad_token: str = field(
|
225 |
+
default="[PAD]",
|
226 |
+
metadata={"help": "The padding token for the tokenizer"},
|
227 |
+
)
|
228 |
+
word_delimiter_token: str = field(
|
229 |
+
default="|",
|
230 |
+
metadata={"help": "The word delimiter token for the tokenizer"},
|
231 |
+
)
|
232 |
+
phoneme_language: Optional[str] = field(
|
233 |
+
default=None,
|
234 |
+
metadata={
|
235 |
+
"help": "The target language that should be used be"
|
236 |
+
" passed to the tokenizer for tokenization. Note that"
|
237 |
+
" this is only relevant if the model classifies the"
|
238 |
+
" input audio to a sequence of phoneme sequences."
|
239 |
+
},
|
240 |
+
)
|
241 |
+
|
242 |
+
|
243 |
+
@dataclass
|
244 |
+
class DataCollatorCTCWithPadding:
|
245 |
+
"""
|
246 |
+
Data collator that will dynamically pad the inputs received.
|
247 |
+
Args:
|
248 |
+
processor (:class:`~transformers.AutoProcessor`)
|
249 |
+
The processor used for proccessing the data.
|
250 |
+
padding (:obj:`bool`, :obj:`str` or :class:`~transformers.tokenization_utils_base.PaddingStrategy`, `optional`, defaults to :obj:`True`):
|
251 |
+
Select a strategy to pad the returned sequences (according to the model's padding side and padding index)
|
252 |
+
among:
|
253 |
+
* :obj:`True` or :obj:`'longest'`: Pad to the longest sequence in the batch (or no padding if only a single
|
254 |
+
sequence if provided).
|
255 |
+
* :obj:`'max_length'`: Pad to a maximum length specified with the argument :obj:`max_length` or to the
|
256 |
+
maximum acceptable input length for the model if that argument is not provided.
|
257 |
+
* :obj:`False` or :obj:`'do_not_pad'` (default): No padding (i.e., can output a batch with sequences of
|
258 |
+
different lengths).
|
259 |
+
max_length (:obj:`int`, `optional`):
|
260 |
+
Maximum length of the ``input_values`` of the returned list and optionally padding length (see above).
|
261 |
+
max_length_labels (:obj:`int`, `optional`):
|
262 |
+
Maximum length of the ``labels`` returned list and optionally padding length (see above).
|
263 |
+
pad_to_multiple_of (:obj:`int`, `optional`):
|
264 |
+
If set will pad the sequence to a multiple of the provided value.
|
265 |
+
This is especially useful to enable the use of Tensor Cores on NVIDIA hardware with compute capability >=
|
266 |
+
7.5 (Volta).
|
267 |
+
"""
|
268 |
+
|
269 |
+
processor: AutoProcessor
|
270 |
+
padding: Union[bool, str] = "longest"
|
271 |
+
pad_to_multiple_of: Optional[int] = None
|
272 |
+
pad_to_multiple_of_labels: Optional[int] = None
|
273 |
+
|
274 |
+
def __call__(self, features: List[Dict[str, Union[List[int], torch.Tensor]]]) -> Dict[str, torch.Tensor]:
|
275 |
+
# split inputs and labels since they have to be of different lenghts and need
|
276 |
+
# different padding methods
|
277 |
+
input_features = [{"input_values": feature["input_values"]} for feature in features]
|
278 |
+
label_features = [{"input_ids": feature["labels"]} for feature in features]
|
279 |
+
|
280 |
+
batch = self.processor.pad(
|
281 |
+
input_features,
|
282 |
+
padding=self.padding,
|
283 |
+
pad_to_multiple_of=self.pad_to_multiple_of,
|
284 |
+
return_tensors="pt",
|
285 |
+
)
|
286 |
+
|
287 |
+
with self.processor.as_target_processor():
|
288 |
+
labels_batch = self.processor.pad(
|
289 |
+
label_features,
|
290 |
+
padding=self.padding,
|
291 |
+
pad_to_multiple_of=self.pad_to_multiple_of_labels,
|
292 |
+
return_tensors="pt",
|
293 |
+
)
|
294 |
+
|
295 |
+
# replace padding with -100 to ignore loss correctly
|
296 |
+
labels = labels_batch["input_ids"].masked_fill(labels_batch.attention_mask.ne(1), -100)
|
297 |
+
|
298 |
+
batch["labels"] = labels
|
299 |
+
|
300 |
+
return batch
|
301 |
+
|
302 |
+
|
303 |
+
def create_vocabulary_from_data(
|
304 |
+
datasets: DatasetDict,
|
305 |
+
word_delimiter_token: Optional[str] = None,
|
306 |
+
unk_token: Optional[str] = None,
|
307 |
+
pad_token: Optional[str] = None,
|
308 |
+
):
|
309 |
+
# Given training and test labels create vocabulary
|
310 |
+
#def extract_all_chars(batch):
|
311 |
+
# all_text = " ".join(batch["target_text"])
|
312 |
+
# vocab = list(set(all_text))
|
313 |
+
# return {"vocab": [vocab], "all_text": [all_text]}
|
314 |
+
#
|
315 |
+
#vocabs = datasets.map(
|
316 |
+
# extract_all_chars,
|
317 |
+
# batched=True,
|
318 |
+
# batch_size=-1,
|
319 |
+
# keep_in_memory=True,
|
320 |
+
# remove_columns=datasets["train"].column_names,
|
321 |
+
#)
|
322 |
+
|
323 |
+
#print(vocabs)
|
324 |
+
#print(vocabs['train'][0])
|
325 |
+
#print(vocabs['train'][0]['vocab'])
|
326 |
+
|
327 |
+
# take union of all unique characters in each dataset
|
328 |
+
#vocab_set = functools.reduce(
|
329 |
+
# lambda vocab_1, vocab_2: set(vocab_1["vocab"][0]) | set(vocab_2["vocab"][0]), vocabs.values()
|
330 |
+
#)
|
331 |
+
#vocab_set = [str(char) for char in vocabs['train'][0]['vocab']]
|
332 |
+
vocab_set = list(set(
|
333 |
+
['i', 'ó', 'k', 'f', 'ô', 'n', 't', 'â', 'ä', 'o', 'a', 'v', 'g', 'b', 'ç', 'w', 'c', ' ', 'ë', 'ê', 'è', 'h', 'y', 'r', 'à', 'p', 'm', 'é', 'q', 'u', 'e', 's', 'ö', 'x', 'j', 'l', 'z', 'd', 'ï'] +
|
334 |
+
['a', 'b', 'c', 'd', 'e', 'f', 'g', 'h', 'i', 'j', 'k', 'l', 'm', 'n', 'o', 'p', 'q', 'r', 'r', 's', 't', 'u', 'v', 'w', 'x', 'y', 'z', 'à', 'â', 'ä', 'æ', 'ç', 'è', 'é', 'ê', 'ë', 'î', 'ï', 'ó', 'ô', 'ö', 'ù', 'û', 'ü']
|
335 |
+
))
|
336 |
+
print("vocab_set: ")
|
337 |
+
print(vocab_set)
|
338 |
+
|
339 |
+
vocab_dict = {v: k for k, v in enumerate(sorted(list(vocab_set)))}
|
340 |
+
|
341 |
+
# replace white space with delimiter token
|
342 |
+
if word_delimiter_token is not None:
|
343 |
+
vocab_dict[word_delimiter_token] = vocab_dict[" "]
|
344 |
+
del vocab_dict[" "]
|
345 |
+
|
346 |
+
# add unk and pad token
|
347 |
+
if unk_token is not None:
|
348 |
+
vocab_dict[unk_token] = len(vocab_dict)
|
349 |
+
|
350 |
+
if pad_token is not None:
|
351 |
+
vocab_dict[pad_token] = len(vocab_dict)
|
352 |
+
|
353 |
+
return vocab_dict
|
354 |
+
|
355 |
+
|
356 |
+
def main():
|
357 |
+
# See all possible arguments in src/transformers/training_args.py
|
358 |
+
# or by passing the --help flag to this script.
|
359 |
+
# We now keep distinct sets of args, for a cleaner separation of concerns.
|
360 |
+
|
361 |
+
parser = HfArgumentParser((ModelArguments, DataTrainingArguments, TrainingArguments))
|
362 |
+
if len(sys.argv) == 2 and sys.argv[1].endswith(".json"):
|
363 |
+
# If we pass only one argument to the script and it's the path to a json file,
|
364 |
+
# let's parse it to get our arguments.
|
365 |
+
model_args, data_args, training_args = parser.parse_json_file(json_file=os.path.abspath(sys.argv[1]))
|
366 |
+
else:
|
367 |
+
model_args, data_args, training_args = parser.parse_args_into_dataclasses()
|
368 |
+
|
369 |
+
# Detecting last checkpoint.
|
370 |
+
last_checkpoint = None
|
371 |
+
if os.path.isdir(training_args.output_dir) and training_args.do_train and not training_args.overwrite_output_dir:
|
372 |
+
last_checkpoint = get_last_checkpoint(training_args.output_dir)
|
373 |
+
if last_checkpoint is None and len(os.listdir(training_args.output_dir)) > 0:
|
374 |
+
raise ValueError(
|
375 |
+
f"Output directory ({training_args.output_dir}) already exists and is not empty. "
|
376 |
+
"Use --overwrite_output_dir to overcome."
|
377 |
+
)
|
378 |
+
elif last_checkpoint is not None:
|
379 |
+
logger.info(
|
380 |
+
f"Checkpoint detected, resuming training at {last_checkpoint}. To avoid this behavior, change "
|
381 |
+
"the `--output_dir` or add `--overwrite_output_dir` to train from scratch."
|
382 |
+
)
|
383 |
+
|
384 |
+
# Setup logging
|
385 |
+
logging.basicConfig(
|
386 |
+
format="%(asctime)s - %(levelname)s - %(name)s - %(message)s",
|
387 |
+
datefmt="%m/%d/%Y %H:%M:%S",
|
388 |
+
handlers=[logging.StreamHandler(sys.stdout)],
|
389 |
+
)
|
390 |
+
logger.setLevel(logging.INFO if is_main_process(training_args.local_rank) else logging.WARN)
|
391 |
+
|
392 |
+
# Log on each process the small summary:
|
393 |
+
logger.warning(
|
394 |
+
f"Process rank: {training_args.local_rank}, device: {training_args.device}, n_gpu: {training_args.n_gpu}"
|
395 |
+
f"distributed training: {bool(training_args.local_rank != -1)}, 16-bits training: {training_args.fp16}"
|
396 |
+
)
|
397 |
+
# Set the verbosity to info of the Transformers logger (on main process only):
|
398 |
+
if is_main_process(training_args.local_rank):
|
399 |
+
transformers.utils.logging.set_verbosity_info()
|
400 |
+
logger.info("Training/evaluation parameters %s", training_args)
|
401 |
+
|
402 |
+
# Set seed before initializing model.
|
403 |
+
set_seed(training_args.seed)
|
404 |
+
|
405 |
+
# 1. First, let's load the dataset
|
406 |
+
raw_datasets = DatasetDict()
|
407 |
+
raw_datasets_source = load_from_disk(data_args.dataset_name)
|
408 |
+
|
409 |
+
if training_args.do_train:
|
410 |
+
raw_datasets["train"] = raw_datasets_source[data_args.train_split_name] # UPDATED
|
411 |
+
|
412 |
+
if data_args.audio_column_name not in raw_datasets["train"].column_names:
|
413 |
+
raise ValueError(
|
414 |
+
f"--audio_column_name '{data_args.audio_column_name}' not found in dataset '{data_args.dataset_name}'. "
|
415 |
+
"Make sure to set `--audio_column_name` to the correct audio column - one of "
|
416 |
+
f"{', '.join(raw_datasets['train'].column_names)}."
|
417 |
+
)
|
418 |
+
|
419 |
+
if data_args.text_column_name not in raw_datasets["train"].column_names:
|
420 |
+
raise ValueError(
|
421 |
+
f"--text_column_name {data_args.text_column_name} not found in dataset '{data_args.dataset_name}'. "
|
422 |
+
"Make sure to set `--text_column_name` to the correct text column - one of "
|
423 |
+
f"{', '.join(raw_datasets['train'].column_names)}."
|
424 |
+
)
|
425 |
+
|
426 |
+
if data_args.max_train_samples is not None:
|
427 |
+
raw_datasets["train"] = raw_datasets["train"].select(range(data_args.max_train_samples))
|
428 |
+
|
429 |
+
if training_args.do_eval:
|
430 |
+
raw_datasets["eval"] = raw_datasets_source[data_args.eval_split_name] # UPDATED
|
431 |
+
|
432 |
+
if data_args.max_eval_samples is not None:
|
433 |
+
raw_datasets["eval"] = raw_datasets["eval"].select(range(data_args.max_eval_samples))
|
434 |
+
|
435 |
+
# 2. We remove some special characters from the datasets
|
436 |
+
# that make training complicated and do not help in transcribing the speech
|
437 |
+
# E.g. characters, such as `,` and `.` do not really have an acoustic characteristic
|
438 |
+
# that could be easily picked up by the model
|
439 |
+
chars_to_ignore_regex = (
|
440 |
+
f'[{"".join(data_args.chars_to_ignore)}]' if data_args.chars_to_ignore is not None else None
|
441 |
+
)
|
442 |
+
text_column_name = data_args.text_column_name
|
443 |
+
|
444 |
+
def remove_special_characters_and_words(batch):
|
445 |
+
if chars_to_ignore_regex is not None:
|
446 |
+
batch["target_text"] = re.sub(chars_to_ignore_regex, "", batch[text_column_name]).lower() + " "
|
447 |
+
else:
|
448 |
+
batch["target_text"] = batch[text_column_name].lower() + " "
|
449 |
+
replacements = [
|
450 |
+
(r"(^| )('k)\b"," ik"),
|
451 |
+
(r"(^| )('t)\b"," het"),
|
452 |
+
(r"(^| )('m)\b"," hem"),
|
453 |
+
(r"(^| )('r)\b"," haar"),
|
454 |
+
(r"(^| )(h'r)\b"," haar"),
|
455 |
+
#(r"\b(d'r)\b","daar"), # can be `der`, `haar` or `er` too so...
|
456 |
+
(r"(^| )(m'n)\b"," mijn"),
|
457 |
+
]
|
458 |
+
for source, target in replacements:
|
459 |
+
batch["target_text"] = re.sub(source, target, batch["target_text"])
|
460 |
+
batch["target_text"] = re.sub(r' *\b(hu[hum]*|uh[hum]*|hé|hè|mm+[uh]*)\b *', ' ', batch["target_text"])
|
461 |
+
batch["target_text"] = re.sub(r' +', ' ', batch["target_text"]).strip() + ' '
|
462 |
+
return batch
|
463 |
+
|
464 |
+
with training_args.main_process_first(desc="dataset map special characters removal"):
|
465 |
+
raw_datasets = raw_datasets.map(
|
466 |
+
remove_special_characters_and_words,
|
467 |
+
remove_columns=[text_column_name],
|
468 |
+
desc="remove special characters from datasets",
|
469 |
+
)
|
470 |
+
raw_datasets = raw_datasets.filter(lambda batch: len(batch['target_text']) > 0)
|
471 |
+
|
472 |
+
# save special tokens for tokenizer
|
473 |
+
word_delimiter_token = data_args.word_delimiter_token
|
474 |
+
unk_token = data_args.unk_token
|
475 |
+
pad_token = data_args.pad_token
|
476 |
+
|
477 |
+
# 3. Next, let's load the config as we might need it to create
|
478 |
+
# the tokenizer
|
479 |
+
# load config
|
480 |
+
config = AutoConfig.from_pretrained(
|
481 |
+
model_args.model_name_or_path, cache_dir=model_args.cache_dir, use_auth_token=data_args.use_auth_token
|
482 |
+
)
|
483 |
+
|
484 |
+
# 4. Next, if no tokenizer file is defined,
|
485 |
+
# we create the vocabulary of the model by extracting all unique characters from
|
486 |
+
# the training and evaluation datasets
|
487 |
+
# We need to make sure that only first rank saves vocabulary
|
488 |
+
# make sure all processes wait until vocab is created
|
489 |
+
tokenizer_name_or_path = model_args.tokenizer_name_or_path
|
490 |
+
tokenizer_kwargs = {}
|
491 |
+
if tokenizer_name_or_path is None:
|
492 |
+
# save vocab in training output dir
|
493 |
+
tokenizer_name_or_path = training_args.output_dir
|
494 |
+
|
495 |
+
vocab_file = os.path.join(tokenizer_name_or_path, "vocab.json")
|
496 |
+
|
497 |
+
with training_args.main_process_first():
|
498 |
+
if training_args.overwrite_output_dir and os.path.isfile(vocab_file):
|
499 |
+
os.remove(vocab_file)
|
500 |
+
|
501 |
+
with training_args.main_process_first(desc="dataset map vocabulary creation"):
|
502 |
+
if not os.path.isfile(vocab_file):
|
503 |
+
os.makedirs(tokenizer_name_or_path, exist_ok=True)
|
504 |
+
vocab_dict = create_vocabulary_from_data(
|
505 |
+
raw_datasets,
|
506 |
+
word_delimiter_token=word_delimiter_token,
|
507 |
+
unk_token=unk_token,
|
508 |
+
pad_token=pad_token,
|
509 |
+
)
|
510 |
+
|
511 |
+
# save vocab dict to be loaded into tokenizer
|
512 |
+
with open(vocab_file, "w") as file:
|
513 |
+
json.dump(vocab_dict, file)
|
514 |
+
|
515 |
+
# if tokenizer has just been created
|
516 |
+
# it is defined by `tokenizer_class` if present in config else by `model_type`
|
517 |
+
tokenizer_kwargs = {
|
518 |
+
"config": config if config.tokenizer_class is not None else None,
|
519 |
+
"tokenizer_type": config.model_type if config.tokenizer_class is None else None,
|
520 |
+
"unk_token": unk_token,
|
521 |
+
"pad_token": pad_token,
|
522 |
+
"word_delimiter_token": word_delimiter_token,
|
523 |
+
}
|
524 |
+
|
525 |
+
# 5. Now we can instantiate the feature extractor, tokenizer and model
|
526 |
+
# Note for distributed training, the .from_pretrained methods guarantee that only
|
527 |
+
# one local process can concurrently download model & vocab.
|
528 |
+
|
529 |
+
# load feature_extractor and tokenizer
|
530 |
+
tokenizer = AutoTokenizer.from_pretrained(
|
531 |
+
tokenizer_name_or_path,
|
532 |
+
use_auth_token=data_args.use_auth_token,
|
533 |
+
**tokenizer_kwargs,
|
534 |
+
)
|
535 |
+
feature_extractor = AutoFeatureExtractor.from_pretrained(
|
536 |
+
model_args.model_name_or_path, cache_dir=model_args.cache_dir, use_auth_token=data_args.use_auth_token
|
537 |
+
)
|
538 |
+
|
539 |
+
# adapt config
|
540 |
+
config.update(
|
541 |
+
{
|
542 |
+
"feat_proj_dropout": model_args.feat_proj_dropout,
|
543 |
+
"attention_dropout": model_args.attention_dropout,
|
544 |
+
"hidden_dropout": model_args.hidden_dropout,
|
545 |
+
"final_dropout": model_args.final_dropout,
|
546 |
+
"mask_time_prob": model_args.mask_time_prob,
|
547 |
+
"mask_time_length": model_args.mask_time_length,
|
548 |
+
"mask_feature_prob": model_args.mask_feature_prob,
|
549 |
+
"mask_feature_length": model_args.mask_feature_length,
|
550 |
+
"gradient_checkpointing": training_args.gradient_checkpointing,
|
551 |
+
"layerdrop": model_args.layerdrop,
|
552 |
+
"ctc_loss_reduction": model_args.ctc_loss_reduction,
|
553 |
+
"pad_token_id": tokenizer.pad_token_id,
|
554 |
+
"vocab_size": len(tokenizer),
|
555 |
+
"activation_dropout": model_args.activation_dropout,
|
556 |
+
}
|
557 |
+
)
|
558 |
+
|
559 |
+
# create model
|
560 |
+
model = AutoModelForCTC.from_pretrained(
|
561 |
+
model_args.model_name_or_path,
|
562 |
+
cache_dir=model_args.cache_dir,
|
563 |
+
config=config,
|
564 |
+
use_auth_token=data_args.use_auth_token,
|
565 |
+
)
|
566 |
+
|
567 |
+
# freeze encoder
|
568 |
+
if model_args.freeze_feature_encoder:
|
569 |
+
model.freeze_feature_encoder()
|
570 |
+
for layer in range(23):
|
571 |
+
for param in model.wav2vec2.encoder.layers[layer].parameters():
|
572 |
+
param.requires_grad = False
|
573 |
+
|
574 |
+
# 6. Now we preprocess the datasets including loading the audio, resampling and normalization
|
575 |
+
# Thankfully, `datasets` takes care of automatically loading and resampling the audio,
|
576 |
+
# so that we just need to set the correct target sampling rate and normalize the input
|
577 |
+
# via the `feature_extractor`
|
578 |
+
|
579 |
+
# make sure that dataset decodes audio with correct sampling rate
|
580 |
+
# UPDATED:
|
581 |
+
dataset_sampling_rate = 16000
|
582 |
+
#dataset_sampling_rate = next(iter(raw_datasets.values())).features[data_args.audio_column_name].sampling_rate
|
583 |
+
#if dataset_sampling_rate != feature_extractor.sampling_rate:
|
584 |
+
# raw_datasets = raw_datasets.cast_column(
|
585 |
+
# data_args.audio_column_name, datasets.features.Audio(sampling_rate=feature_extractor.sampling_rate)
|
586 |
+
# )
|
587 |
+
|
588 |
+
# derive max & min input length for sample rate & max duration
|
589 |
+
max_input_length = data_args.max_duration_in_seconds * feature_extractor.sampling_rate
|
590 |
+
min_input_length = data_args.min_duration_in_seconds * feature_extractor.sampling_rate
|
591 |
+
audio_column_name = data_args.audio_column_name
|
592 |
+
num_workers = data_args.preprocessing_num_workers
|
593 |
+
|
594 |
+
# `phoneme_language` is only relevant if the model is fine-tuned on phoneme classification
|
595 |
+
phoneme_language = data_args.phoneme_language
|
596 |
+
|
597 |
+
# Preprocessing the datasets.
|
598 |
+
# We need to read the audio files as arrays and tokenize the targets.
|
599 |
+
def prepare_dataset(batch):
|
600 |
+
# load audio
|
601 |
+
sample = batch[audio_column_name]
|
602 |
+
|
603 |
+
inputs = feature_extractor(sample["array"], sampling_rate=sample["sampling_rate"])
|
604 |
+
batch["input_values"] = inputs.input_values[0]
|
605 |
+
batch["input_length"] = len(batch["input_values"])
|
606 |
+
|
607 |
+
# encode targets
|
608 |
+
additional_kwargs = {}
|
609 |
+
if phoneme_language is not None:
|
610 |
+
additional_kwargs["phonemizer_lang"] = phoneme_language
|
611 |
+
|
612 |
+
batch["labels"] = tokenizer(batch["target_text"], **additional_kwargs).input_ids
|
613 |
+
return batch
|
614 |
+
|
615 |
+
with training_args.main_process_first(desc="dataset map preprocessing"):
|
616 |
+
vectorized_datasets = raw_datasets.map(
|
617 |
+
prepare_dataset,
|
618 |
+
remove_columns=next(iter(raw_datasets.values())).column_names,
|
619 |
+
num_proc=num_workers,
|
620 |
+
desc="preprocess datasets",
|
621 |
+
)
|
622 |
+
# fix bug with eval dataset
|
623 |
+
raw_datasets['eval'] = raw_datasets['eval'].filter(lambda batch: len(batch['target_text']) > 2)
|
624 |
+
vectorized_datasets['eval'] = raw_datasets['eval'].map(
|
625 |
+
prepare_dataset,
|
626 |
+
remove_columns=next(iter(raw_datasets.values())).column_names,
|
627 |
+
num_proc=num_workers,
|
628 |
+
desc="preprocess datasets",
|
629 |
+
)
|
630 |
+
def is_audio_in_length_range(length):
|
631 |
+
return length > min_input_length and length < max_input_length
|
632 |
+
|
633 |
+
# filter data that is shorter than min_input_length
|
634 |
+
vectorized_datasets = vectorized_datasets.filter(
|
635 |
+
is_audio_in_length_range,
|
636 |
+
num_proc=num_workers,
|
637 |
+
input_columns=["input_length"],
|
638 |
+
)
|
639 |
+
|
640 |
+
|
641 |
+
# 7. Next, we can prepare the training.
|
642 |
+
# Let's use word error rate (WER) as our evaluation metric,
|
643 |
+
# instantiate a data collator and the trainer
|
644 |
+
|
645 |
+
# Define evaluation metrics during training, *i.e.* word error rate, character error rate
|
646 |
+
eval_metrics = {metric: load_metric(metric) for metric in data_args.eval_metrics}
|
647 |
+
|
648 |
+
# for large datasets it is advised to run the preprocessing on a
|
649 |
+
# single machine first with ``args.preprocessing_only`` since there will mostly likely
|
650 |
+
# be a timeout when running the script in distributed mode.
|
651 |
+
# In a second step ``args.preprocessing_only`` can then be set to `False` to load the
|
652 |
+
# cached dataset
|
653 |
+
if data_args.preprocessing_only:
|
654 |
+
logger.info(f"Data preprocessing finished. Files cached at {vectorized_datasets.cache_files}")
|
655 |
+
return
|
656 |
+
|
657 |
+
def compute_metrics(pred):
|
658 |
+
pred_logits = pred.predictions
|
659 |
+
pred_ids = np.argmax(pred_logits, axis=-1)
|
660 |
+
|
661 |
+
pred.label_ids[pred.label_ids == -100] = tokenizer.pad_token_id
|
662 |
+
|
663 |
+
pred_str = tokenizer.batch_decode(pred_ids)
|
664 |
+
# we do not want to group tokens when computing the metrics
|
665 |
+
label_str = tokenizer.batch_decode(pred.label_ids, group_tokens=False)
|
666 |
+
|
667 |
+
metrics = {k: v.compute(predictions=pred_str, references=label_str) for k, v in eval_metrics.items()}
|
668 |
+
|
669 |
+
return metrics
|
670 |
+
|
671 |
+
# Now save everything to be able to create a single processor later
|
672 |
+
if is_main_process(training_args.local_rank):
|
673 |
+
# save feature extractor, tokenizer and config
|
674 |
+
feature_extractor.save_pretrained(training_args.output_dir)
|
675 |
+
tokenizer.save_pretrained(training_args.output_dir)
|
676 |
+
config.save_pretrained(training_args.output_dir)
|
677 |
+
|
678 |
+
try:
|
679 |
+
processor = AutoProcessor.from_pretrained(training_args.output_dir)
|
680 |
+
except (OSError, KeyError):
|
681 |
+
warnings.warn(
|
682 |
+
"Loading a processor from a feature extractor config that does not"
|
683 |
+
" include a `processor_class` attribute is deprecated and will be removed in v5. Please add the following "
|
684 |
+
" attribute to your `preprocessor_config.json` file to suppress this warning: "
|
685 |
+
" `'processor_class': 'Wav2Vec2Processor'`",
|
686 |
+
FutureWarning,
|
687 |
+
)
|
688 |
+
processor = Wav2Vec2Processor.from_pretrained(training_args.output_dir)
|
689 |
+
|
690 |
+
# Instantiate custom data collator
|
691 |
+
data_collator = DataCollatorCTCWithPadding(processor=processor)
|
692 |
+
|
693 |
+
# Initialize Trainer
|
694 |
+
trainer = Trainer(
|
695 |
+
model=model,
|
696 |
+
data_collator=data_collator,
|
697 |
+
args=training_args,
|
698 |
+
compute_metrics=compute_metrics,
|
699 |
+
train_dataset=vectorized_datasets["train"] if training_args.do_train else None,
|
700 |
+
eval_dataset=vectorized_datasets["eval"] if training_args.do_eval else None,
|
701 |
+
tokenizer=feature_extractor,
|
702 |
+
)
|
703 |
+
|
704 |
+
# 8. Finally, we can start training
|
705 |
+
|
706 |
+
# Training
|
707 |
+
if training_args.do_train:
|
708 |
+
|
709 |
+
# use last checkpoint if exist
|
710 |
+
if last_checkpoint is not None:
|
711 |
+
checkpoint = last_checkpoint
|
712 |
+
elif os.path.isdir(model_args.model_name_or_path):
|
713 |
+
checkpoint = model_args.model_name_or_path
|
714 |
+
else:
|
715 |
+
checkpoint = None
|
716 |
+
|
717 |
+
train_result = trainer.train(resume_from_checkpoint=checkpoint)
|
718 |
+
trainer.save_model()
|
719 |
+
|
720 |
+
metrics = train_result.metrics
|
721 |
+
max_train_samples = (
|
722 |
+
data_args.max_train_samples
|
723 |
+
if data_args.max_train_samples is not None
|
724 |
+
else len(vectorized_datasets["train"])
|
725 |
+
)
|
726 |
+
metrics["train_samples"] = min(max_train_samples, len(vectorized_datasets["train"]))
|
727 |
+
|
728 |
+
trainer.log_metrics("train", metrics)
|
729 |
+
trainer.save_metrics("train", metrics)
|
730 |
+
trainer.save_state()
|
731 |
+
|
732 |
+
# Evaluation
|
733 |
+
results = {}
|
734 |
+
if training_args.do_eval:
|
735 |
+
logger.info("*** Evaluate ***")
|
736 |
+
metrics = trainer.evaluate()
|
737 |
+
max_eval_samples = (
|
738 |
+
data_args.max_eval_samples if data_args.max_eval_samples is not None else len(vectorized_datasets["eval"])
|
739 |
+
)
|
740 |
+
metrics["eval_samples"] = min(max_eval_samples, len(vectorized_datasets["eval"]))
|
741 |
+
|
742 |
+
trainer.log_metrics("eval", metrics)
|
743 |
+
trainer.save_metrics("eval", metrics)
|
744 |
+
|
745 |
+
# Write model card and (optionally) push to hub
|
746 |
+
config_name = data_args.dataset_config_name if data_args.dataset_config_name is not None else "na"
|
747 |
+
kwargs = {
|
748 |
+
"finetuned_from": model_args.model_name_or_path,
|
749 |
+
"tasks": "speech-recognition",
|
750 |
+
"tags": ["automatic-speech-recognition", data_args.dataset_name],
|
751 |
+
"dataset_args": f"Config: {config_name}, Training split: {data_args.train_split_name}, Eval split: {data_args.eval_split_name}",
|
752 |
+
"dataset": f"{data_args.dataset_name.upper()} - {config_name.upper()}",
|
753 |
+
}
|
754 |
+
if "common_voice" in data_args.dataset_name:
|
755 |
+
kwargs["language"] = config_name
|
756 |
+
|
757 |
+
if training_args.push_to_hub:
|
758 |
+
trainer.push_to_hub(**kwargs)
|
759 |
+
else:
|
760 |
+
trainer.create_model_card(**kwargs)
|
761 |
+
|
762 |
+
return results
|
763 |
+
|
764 |
+
|
765 |
+
if __name__ == "__main__":
|
766 |
+
main()
|
special_tokens_map.json
ADDED
@@ -0,0 +1 @@
|
|
|
|
|
1 |
+
{"bos_token": "<s>", "eos_token": "</s>", "unk_token": "[UNK]", "pad_token": "[PAD]", "additional_special_tokens": [{"content": "<s>", "single_word": false, "lstrip": false, "rstrip": false, "normalized": true}, {"content": "</s>", "single_word": false, "lstrip": false, "rstrip": false, "normalized": true}]}
|
speech-recognition-community-v2_dev_data_nl_validation_eval_results.txt
ADDED
@@ -0,0 +1,2 @@
|
|
|
|
|
|
|
1 |
+
WER: 0.16356421777440625
|
2 |
+
CER: 0.09647157806173423
|
tokenizer_config.json
ADDED
@@ -0,0 +1 @@
|
|
|
|
|
1 |
+
{"unk_token": "[UNK]", "bos_token": "[PAD]", "eos_token": "[PAD]", "pad_token": "[PAD]", "do_lower_case": false, "word_delimiter_token": "|", "special_tokens_map_file": "special_tokens_map.json", "tokenizer_file": null, "name_or_path": "./xls-r-translate-nl-v2", "tokenizer_class": "Wav2Vec2CTCTokenizer", "processor_class": "Wav2Vec2ProcessorWithLM"}
|
vocab.json
ADDED
@@ -0,0 +1 @@
|
|
|
|
|
1 |
+
{"a": 1, "b": 2, "c": 3, "d": 4, "e": 5, "f": 6, "g": 7, "h": 8, "i": 9, "j": 10, "k": 11, "l": 12, "m": 13, "n": 14, "o": 15, "p": 16, "q": 17, "r": 18, "s": 19, "t": 20, "u": 21, "v": 22, "w": 23, "x": 24, "y": 25, "z": 26, "à": 27, "â": 28, "ä": 29, "æ": 30, "ç": 31, "è": 32, "é": 33, "ê": 34, "ë": 35, "î": 36, "ï": 37, "ó": 38, "ô": 39, "ö": 40, "ù": 41, "û": 42, "ü": 43, "|": 0, "[UNK]": 44, "[PAD]": 45}
|