# 複数データセットトレーニング

Icedit Normal Lora
その他
これはLoRA技術に基づく画像から画像への変換モデルで、主に非商用の画像編集タスクに使用されます。
画像生成 英語
I
RiverZ
1,046
7
TIPO 500M Ft
その他
TIPOはテキスト事前サンプリングに基づくプロンプト最適化テキスト・トゥ・イメージシステムで、大規模言語モデルを使用してユーザー入力プロンプトを最適化し、生成モデルの品質と使いやすさを向上させます。
テキスト生成画像 英語
T
KBlueLeaf
10.92k
29
F5 Hindi 24KHz
F5アーキテクチャに基づいてゼロからトレーニングされたヒンディー語テキスト読み上げモデルで、インド工科大学マドラス校SPRING研究所によって開発されました。
音声合成 その他
F
SPRINGLab
1,430
18
Noobai Xl Nai Xl Epsilonpred10version Sdxl
その他
SDXLベースのアニメスタイルテキスト生成画像モデルで、初心者にも使いやすく、高品質なアニメキャラクターやスタイリッシュな画像を生成できます。
画像生成 英語
N
John6666
87
3
TIPO 500M
その他
TIPOはLLaMAアーキテクチャを採用した5億パラメータのモデルで、テキストから画像生成におけるプロンプト最適化のために設計されています。
テキスト生成画像 英語
T
KBlueLeaf
2,013
51
Whisper Tiny Vi
Apache-2.0
OpenAI Whisper-tinyアーキテクチャをベースにファインチューニングしたベトナム語自動音声認識(ASR)モデルで、複数のベトナム語データセットで優れた性能を発揮
音声認識 Transformers その他
W
doof-ferb
44
2
Deberta V3 Large Mnli Fever Anli Ling Wanli Binary
MIT
このモデルはDeBERTa-v3-largeアーキテクチャに基づくゼロショット分類モデルで、主に5つのNLIデータセットでトレーニングされており、元のNLIタスクに従うタスクに適しています。
テキスト分類 Transformers 英語
D
MoritzLaurer
30
0
Ag Nli DeTS Sentence Similarity V1
Apache-2.0
このモデルはSentenceTransformersのCross-Encoderクラスを使用してトレーニングされ、2つの文の意味的類似度のスコアを予測するために使用されます。
テキスト埋め込み Transformers 複数言語対応
A
abbasgolestani
982
0
Gpt2 Bangla Summurizer
これはGPT2アーキテクチャに基づくベンガル語テキスト要約生成モデルで、特にニュースコンテンツに最適化されています。
テキスト生成 Transformers その他
G
faridulreza
18
0
Vegam Whisper Medium Ml
MIT
これはthennal/whisper-medium-mlをCTranslate2モデル形式に変換したバージョンで、マラヤーラム語音声認識に使用されます
音声認識 その他
V
smcproject
83
5
Stt Es Conformer Transducer Large
これはスペイン語自動音声認識用の大型Conformer-トランスデューサーモデルで、約1.2億パラメータを持ち、1340時間のスペイン語音声データでトレーニングされています。
音声認識 スペイン語
S
nvidia
708
4
Stt Es Conformer Ctc Large
これはNVIDIAがトレーニングし公開した、スペイン語自動音声認識(ASR)用の大型Conformer-CTCモデルです。
音声認識 スペイン語
S
nvidia
59
2
Stt Fr Conformer Transducer Large
これはフランス語自動音声認識のための大規模なConformer-トランスデューサーモデルで、約1.2億のパラメータを持ち、1500時間以上のフランス語音声データでトレーニングされています。
音声認識 フランス語
S
nvidia
31
10
Wav2vec2 Base Vietnamese 160h
Wav2vec2ベースのベトナム語音声認識モデル、160時間のベトナム語音声データでファインチューニング
音声認識 Transformers その他
W
khanhld
356
10
Wav2vec2 Large Xlsr 53 Coraa Brazilian Portuguese Gain Normalization Sna
Apache-2.0
これはポルトガル語に特化してファインチューニングされたWav2vec 2.0モデルで、CORAA、CETUC、多言語LibriSpeechなど複数のポルトガル語音声データセットを使用してトレーニングされました。
音声認識 Transformers その他
W
alefiury
23
2
Wav2vec2 Xls R 1b Portuguese
Apache-2.0
これはXLS-R 1Bアーキテクチャに基づくポルトガル語自動音声認識モデルで、複数のポルトガル語音声データセットでファインチューニングされています。
音声認識 Transformers その他
W
jonatasgrosman
648.50k
12
Wav2vec2 Xls R 1b Italian
Apache-2.0
これはXLS-R 1Bアーキテクチャに基づくイタリア語自動音声認識モデルで、複数のイタリア語データセットでファインチューニングされています
音声認識 Transformers その他
W
jonatasgrosman
2,703
1
Fine Tune XLSR Wav2Vec2 Speech2Text Vietnamese
Apache-2.0
これはMT5アーキテクチャに基づくベトナム語自動音声認識(ASR)修復モデルで、ベトナム語音声認識タスク向けにファインチューニングされています。
音声認識 その他
F
leduytan93
25
0
Bp500 Base10k Voxpopuli
Apache-2.0
これはブラジルポルトガル語に最適化されたWav2vec 2.0音声認識モデルで、複数のブラジルポルトガル語データセットでファインチューニングされています
音声認識 Transformers その他
B
lgris
23
0
Wav2vec2 Large Xlsr 53 Vietnamese
Apache-2.0
facebook/wav2vec2-large-xlsr-53モデルをベトナム語向けにファインチューニングした自動音声認識モデルで、16kHzサンプリングレートの音声入力をサポートします。
音声認識 Transformers その他
W
not-tanh
22
4
Wav2vec2 Large Xlsr 53 Chinese Zh Cn
Apache-2.0
facebook/wav2vec2-large-xlsr-53モデルをファインチューニングした中国語音声認識モデルで、16kHzサンプリングレートの音声入力をサポートしています。
音声認識 中国語
W
jonatasgrosman
3.8M
110
Wav2vec2 Large Xlsr Vietnamese
Apache-2.0
facebook/wav2vec2-large-xlsr-53モデルをベースにファインチューニングしたベトナム語自動音声認識モデル
音声認識 その他
W
Nhut
22
0
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase