File size: 1,530 Bytes
bfd8a21
 
 
d4a78af
bcadf10
d4a78af
 
 
 
3f863ec
d4a78af
3f863ec
d4a78af
3f863ec
7b15c23
d4a78af
5b9d124
 
 
bcadf10
5b9d124
 
 
 
 
 
 
 
 
 
 
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
---
license: apache-2.0
---

✨ 概要: このモデルは OfficialのPretrained GPT Modelを基に、約650時間分のHシーンボイス(喘ぎ声を除く)でFinetuneされたモデルです。このモデルは、一般的な日本語能力と特定の「そういう」シーンの読み上げ能力においてある程度の改善していたと思います。

🔧 トレーニング詳細:

🖥️ ハードウェア: RTX-4090 x 1

⏳ トレーニング時間: 16時間

🔄 エポック数: DPOなしで15エポック、DPOありで2エポック

📈 今後の計画: https://huggingface.co/AkitoP/GPT-SoVITS-JA-ProsodyControl_model での日本語特化版GPT-SoVITSにおけるFinetune作業も予定しています。この作業を通じて、モデルのさらなる改善を目指します。

🎯 目標: このモデルを用いることで、より自然で感情的な読み上げが可能となり、特に「そういう」シーンにおけるパフォーマンスが大きく向上することを目指しています。


✨ 概要:这个模型是基于官方预训练的GPT模型,通过大约650小时的H场景声音(除去喘息声)进行Fine-tune得到的。

🔧 训练详情:

🖥️ 硬件:RTX-4090 x 1

⏳ 训练时间:16小时

🔄 迭代次数:无DPO训练15个epoch,使用DPO训练2个epoch


🎯 目标:使用这个模型,我们的目标是实现更自然、更富有情感的朗读能力,特别是在“那种”场景下,大幅提升性能。