# 複数データセット融合

F5 TTS Vietnamese 100h
F5-TTSを微調整したコンパクト版で、150時間のベトナム語音声データでトレーニングされており、研究用途のみに限定されます。
音声合成 その他
F
hynt
123
14
Pd Bert
MIT
BERT-baseをファインチューニングした再現検出モデルで、重複コンテンツ検出、Q&Aシステム、意味的類似性分析などのシナリオに適しています。
テキスト分類 Transformers 英語
P
viswadarshan06
23
1
Voc2vec
Apache-2.0
voc2vecは非言語人間データ専用に設計された基礎モデルで、wav2vec 2.0フレームワークを基に構築されており、事前学習データセットには約125時間の非言語音声が含まれています。
音声分類 Transformers 英語
V
alkiskoudounas
223
2
Rei 12B
Rei-12BはClaude 3シリーズモデル(特にSonnetとOpus)の散文品質を再現することを目的とした大規模言語モデルで、Mistral-Nemo-Instructを微調整して作成されました
大規模言語モデル Transformers 英語
R
Delta-Vector
944
26
Stt Uz Fastconformer Hybrid Large Pc
これはFastConformerアーキテクチャに基づく大型ウズベク語音声認識モデルで、TransducerとCTCの二重デコードをサポートし、複数のテストセットで優れた性能を発揮します。
音声認識 その他
S
nvidia
96
6
Llama3 Aloe 8B Alpha
Aloeは次世代の医療大規模言語モデルファミリーで、モデル融合と先進的なプロンプト戦略により、その規模範囲内で全ての先行オープンソースモデルと比較して高い競争力を持ち、最先端の成果を達成しています。
大規模言語モデル Transformers 英語
L
HPAI-BSC
6,663
61
Orca Mini 3b
orca_mini_3bはOpenLLaMa-3Bモデルをベースに訓練されたテキスト生成モデルで、WizardLM、Alpaca、Dolly-V2データセットからの命令と入力を用いて説明的チューニングが施され、Orca研究論文のデータセット構築方法が適用されています。
大規模言語モデル Transformers 英語
O
pankajmathur
4,232
161
Ultima Waifu Diffusion
Openrail
安定拡散技術に基づくテキスト画像生成モデルで、高品質なアニメスタイル画像の生成に特化しています。
画像生成 英語
U
AdamOswald1
112
13
Bp500 Base100k Voxpopuli
Apache-2.0
ブラジルポルトガル語に最適化された音声認識モデル、7つの公開データセット計453時間の音声でトレーニング
音声認識 Transformers その他
B
lgris
23
1
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase