--- license: apache-2.0 --- ✨ 概要: このモデルは OfficialのPretrained GPT Modelを基に、約650時間分のHシーンボイス(喘ぎ声を除く)でFinetuneされたモデルです。このモデルは、一般的な日本語能力と特定の「そういう」シーンの読み上げ能力において顕著な向上を達成していたと思います。 🔧 トレーニング詳細: 🖥️ ハードウェア: RTX-4090 x 1 ⏳ トレーニング時間: 16時間 🔄 エポック数: DPOなしで15エポック、DPOありで2エポック 📈 今後の計画: https://huggingface.co/AkitoP/GPT-SoVITS-JA-ProsodyControl_modelの日本語特化版GPT-SoVITSにおけるFinetune作業も予定しています。この作業を通じて、モデルのさらなる改善を目指します。 🎯 目標: このモデルを用いることで、より自然で感情的な読み上げが可能となり、特に「そういう」シーンにおけるパフォーマンスが大きく向上することを目指しています。