Bartosz Pietrzak commited on
Commit
d5c2f74
unverified
1 Parent(s): e0f9e95

Update README.md

Browse files
Files changed (1) hide show
  1. README.md +11 -100
README.md CHANGED
@@ -1,100 +1,11 @@
1
- # Music Mind
2
-
3
- [Aplikacja gradio projektu](https://huggingface.co/spaces/bjpietrzak/music_mind)
4
-
5
- ## CI/CD Pipeline
6
-
7
- ### 1. **Wyb贸r modelu**
8
-
9
- Je艣li model nie pochodzi z biblioteki HF, trzeba si臋 upewni膰, 偶e jest kompatybilny z klas膮 Trainer biblioteki HuggingFace [LINK](https://huggingface.co/transformers/v3.3.1/training.html)
10
-
11
- ### 2. **Wyb贸r danych trenuj膮cych**
12
-
13
- Je偶eli dataset pochodzi z biblioteki HuggingFace, mo偶na ten krok pomin膮膰.
14
-
15
- 1. Zb贸r ucz膮cy musi posiada膰:
16
- - Pliki muzyczne w formacie; znajduj膮ce si臋 w jednym folderze `[.ogg, .mp3 .wav]`
17
- - Plik json zawieraj膮cy oznaczenia dla wszystkich plik贸w muzycznych:
18
- ```json
19
- {
20
- "file1.ogg": "jazz",
21
- "file2.ogg": "hiphop"
22
- }
23
- ```
24
-
25
- 2. Aby dataset mia艂 form臋 kompatybiln膮 z trenerem HF, dost臋pny zbi贸r danych nale偶y sparsowa膰 za pomoc膮 skryptu `make_dataset.py` znajduj膮cego si臋 w katalogu `dl/` projektu:
26
- ```bash
27
- python make_dataset.py --dir sciezka/do/folderu/plikow/audio --file sciezka/do/pliku/json.json --output lokalizacja/wygenerowanego/datasetu
28
- ```
29
-
30
- ### 3. **Trening Modelu**
31
-
32
- Trening modelu odbywa si臋 poprzez skrypt `train.py` znajduj膮cy si臋 w katalogu `/dl/` projektu.
33
-
34
- Skrupt posiada nast臋puj膮ce flagi:
35
- - learning_rate: Wsp贸艂czynnik uczenia podczas treningu modelu.
36
- - train_eval_split: Stosunek danych trenuj膮cych do ca艂ego zbioru; reszta to dane walidacyjne.
37
- - model_id: Identyfikator modelu z Hugging Face lub 艣cie偶ka do lokalnego modelu.
38
- - num_epochs: Liczba epok treningowych.
39
- - seed: Ziarno liczb losowych.
40
- - save_dir: 艢cie偶ka do katalogu wag tranowanego modelu.
41
- - dataset: Nazwa/lokalizacja zbioru danych.
42
-
43
- Przyk艂adowe uruchomienie skryptu:
44
-
45
- ```bash
46
- python train_audio_model.py --model_id "facebook/wav2vec2-base-960h" --learning_rate 0.0001 --train_eval_split 0.8 --num_epochs 10 --seed 42 --save_dir "/path/to/save/models" --dataset "marsyas/gtzan"
47
- ```
48
-
49
- Wagi i pliki konfiguracyjne modelu zostan膮 zapisane w podanej 艣cierzce pod nazw膮 sk艂adaj膮c膮 si臋 z parametr贸w uczenia np:
50
-
51
- `/path/to/save/facebook-wav2vec2-base-960h-123-marsyas-gtzan-0.0001`
52
-
53
- ### 4. **Wersjonowanie model贸w**
54
-
55
- Modele mo偶na przesy艂a膰 do repozytorium na huggingface.
56
-
57
- Za pomoc膮 skryptu `push_model.py`:
58
-
59
- ```bash
60
- python script_name.py --username your_username --model_dir /path/to/your/model --repo_name your_repo_name --private True
61
- ```
62
-
63
- lub za pomoc膮 GUI strony HuggingFace [LINK](https://huggingface.co/new)
64
-
65
- ![Widok strony pocz膮tkowej zak艂adania repozytorium modelu](images/new.png)
66
-
67
- ![Dodawanie plik贸w do repozytorium](images/file_upload.png)
68
-
69
- Na stronie:
70
-
71
- ![alt text](images/new.png)
72
-
73
- ![alt text](images/file_upload.png)
74
-
75
- ### 6. **Aktualizowanie modelu w deployowanej aplikacji**
76
-
77
- Po dodaniu modelu do repozytorium nale偶y go wykorzysta膰 w deployowanej aplikacji dost臋pnej pod tym adresem:
78
-
79
- `git clone https://huggingface.co/spaces/bjpietrzak/music_mind`
80
-
81
- W katalogu g艂贸wnym projektu znajduje si臋 plik `main.py`. W jego wn臋trzu znajduje si臋 zmienna config:
82
-
83
- ```py
84
- config = {
85
- "sampling_rate": 16000,
86
- "model": "bjpietrzak/distilhubert-gtzan-20-5e-5",
87
- }
88
- ```
89
-
90
- Nazw臋 repozytorium, oraz model mo偶na umie艣ci膰 w warto艣ci klucza `model`, je艣li jest taka potrzeba, nale偶y zmieni膰 sampling rate.
91
-
92
- Po zmianie zmian, nale偶y je pchn膮膰:
93
-
94
- ```bash
95
- git push
96
- ```
97
-
98
- Zmiany powinny by膰 widoczne po kilku minutach:
99
-
100
- ![alt text](images/changes.png)
 
1
+ ---
2
+ title: Music Mind App
3
+ emoji: 馃寲
4
+ colorFrom: pink
5
+ colorTo: pink
6
+ sdk: gradio
7
+ sdk_version: 4.36.1
8
+ app_file: app.py
9
+ pinned: false
10
+ license: mit
11
+ ---