# 多シーン適応

Oute TTS 500M
Apache-2.0
OuteTTSはトルコ語に特化したテキスト音声変換(TTS)モデルで、5億パラメータ規模を持ち、トルコ語テキストを自然な音声に変換できます。
音声合成 その他
O
Karayakar
27
0
Tgiangvoice
Spark-TTSは、大規模言語モデル(LLM)の強力な能力を活用し、高精度で自然な音声合成を実現する先進的なテキスト読み上げシステムです。
音声合成
T
thinhkosay
16
0
Bge Large Zh V1.5 GGUF
MIT
BAAI/bge-large-zh-v1.5は中国語文変換モデルで、主に特徴抽出と文類似度計算に使用されます。
テキスト埋め込み 中国語
B
mradermacher
536
1
Light R1 14B DS GGUF
Apache-2.0
Light-R1-14B-DSは14Bパラメータ規模の量子化大規模言語モデルで、テキスト生成タスクをサポートし、リソースが限られた環境での効率的な推論に適しています。
大規模言語モデル
L
qihoo360
2,784
9
Huihui Ai.granite Vision 3.2 2b Abliterated GGUF
Granite Vision 3.2 2B Abliterated は、画像テキストからテキストへの変換タスクに特化した視覚言語モデルです。
画像生成テキスト
H
DevQuasar
724
1
MMS TTS THAI FEMALE PODCAST
これはタイ語に最適化されたテキスト音声変換(TTS)モデルで、特に女性ポッドキャストスタイルの音声生成に適しています。
音声合成 その他
M
VIZINTZOR
51
0
Pgtformer Base
PGTFormerはPyTorchベースの画像間変換モデルで、PytorchModelHubMixinを通じてHugging Face Hubに統合されています。
画像生成
P
kepeng
151
4
Moondream Caption
Apache-2.0
Moondream2ベースのカスタム小型視覚モデル、画像説明生成タスク向けに微調整
画像生成テキスト Transformers
M
wraps
108
9
Moralbert Predict Subversion In Lyrics
MIT
これはPyTorchベースのテキスト分類モデルで、様々なテキスト分類タスクに適用できます。
テキスト分類 Transformers
M
vjosap
17
1
Chatlaw2 MoE
Apache-2.0
大規模言語モデル Transformers
C
pandalla
56
12
Image Captioning Vit Gpt2 Flick8k
Apache-2.0
このモデルは入力された画像を記述的なテキストに変換することができ、様々なシーンでの画像理解タスクに適用できます。
画像生成テキスト Transformers
I
pltnhan311
18
0
Whisper Large V3 Russian
OpenAI Whisper-large-v3をファインチューニングしたロシア語音声認識モデルで、ロシア語認識性能を最適化
音声認識 Transformers その他
W
antony66
6,665
60
Burp 7B
その他
BuRPは多機能なロールプレイモデルで、ユーザーと高度にインタラクティブなやり取りが可能で、いかなるアクティブなリクエストも拒否せず、特定の対話フォーマットを厳格に遵守します。
大規模言語モデル Transformers 英語
B
ChaoticNeutrals
21
16
Qwen 1.5 Patent Translation
MIT
MITライセンスに基づくオープンソースモデル。具体的な機能は実際のモデルによって異なります
大規模言語モデル Transformers
Q
coggpt
22
1
Tinysolar 248m 4k
Apache-2.0
大規模言語モデル Transformers
T
upstage
284
7
Whisper Large V3 French Distil Dec8
MIT
これはWhisper-Large-V3フランス語モデルの蒸留バージョンで、デコーダー層数を減らすことで推論速度とメモリ使用量を最適化し、良好な性能を維持しています。
音声認識 Transformers フランス語
W
bofenghuang
32
4
Orionstar Yi 34B Chat Llama GGUF
その他
OrionStar Yi 34B Chat Llama は Yi 34B アーキテクチャに基づく大規模言語モデルで、中国語対話タスクに特化しています。
大規模言語モデル その他
O
TheBloke
557
16
E5 Large V2 Onnx
Apache-2.0
これは文や段落を密なベクトル空間にマッピングする文変換モデルで、クラスタリングや意味検索などのタスクに適しています。
テキスト埋め込み 英語
E
nixiesearch
114
0
My Detr
MIT
このモデルはMITライセンスで公開されており、具体的な情報は提供されていません。
大規模言語モデル Transformers
M
Cheaple
25
0
Voidnoisecore R0829
その他
Stable Diffusionベースのテキストから画像を生成するモデルで、テキスト記述に基づき高品質な画像を生成可能です。
画像生成
V
digiplay
48.27k
3
E5 Small V2 Onnx
Apache-2.0
これは文を密ベクトル空間にマッピングする文変換モデルで、意味検索やクラスタリングタスクに適しています。
テキスト埋め込み 英語
E
nixiesearch
221
0
All MiniLM L6 V2 Onnx
Apache-2.0
これはONNXベースの文変換モデルで、テキストを384次元ベクトル空間にマッピングし、意味検索やクラスタリングタスクに適しています。
テキスト埋め込み 英語
A
nixiesearch
187
1
General Image Captioning
Apache-2.0
これはApache-2.0ライセンスに基づく画像からテキストへの変換モデルで、画像の内容をテキスト記述に変換できます。
文字認識 Transformers その他
G
alibidaran
30
0
Shiratakimix
Openrail
2D絵画スタイルに特化した安定拡散融合モデルで、VAEを含むバージョンと含まないバージョンの選択肢を提供
画像生成 日本語
S
Vsukiyaki
531
146
Car Brands Classification
Apache-2.0
BEiTアーキテクチャに基づく事前学習済み画像分類モデルで、ベトナム語タグをサポートし、視覚タスクに適しています
画像分類 Transformers その他
C
lamnt2008
19
3
Treeclassification
様々な一般的な物体やシーンを識別できる画像分類用の視覚モデルです。
画像分類 Transformers
T
OttoYu
22
0
Mscoco Finetuned CoCa ViT L 14 Laion2b S13b B90k
MIT
これはMITライセンスに基づく画像テキスト変換モデルで、画像の内容をテキスト説明に変換できます。
画像生成テキスト
M
laion
21.02k
20
Vivid
MIT
Stable Diffusionモデルのプロンプト生成用モデル
画像生成 英語
V
NoxiusEngine
26
3
Whisper Large Zh Cv11
Apache-2.0
openai/whisper-large-v2をベースに、中国語(北京語)向けにCommon Voice 11データセットでファインチューニングした音声認識モデル
音声認識 Transformers 中国語
W
jonatasgrosman
145
76
Yolov5n Cls V7.0
Gpl-3.0
YOLOv5n-cls-v7.0は、YOLOv5アーキテクチャに基づく軽量な画像分類モデルで、効率的な視覚タスク処理に適しています。
画像分類 Transformers
Y
fcakyon
16
2
Ko Trocr Base Nsmc News Chatbot
MIT
これは韓国語テキスト認識のためのコンセプト検証モデルで、TrOCRアーキテクチャに基づいて訓練され、画像から韓国語テキストを認識できます。
画像生成テキスト Transformers 韓国語
K
daekeun-ml
44
10
Hubert Large Arabic Transcribe
MIT
このモデルはMITライセンスで公開されており、詳細情報は追加が必要です。
大規模言語モデル Transformers
H
asafaya
34
3
TAACO STS
Sentence-transformersフレームワークでトレーニングされた韓国語文類似度モデル、文間の意味的一貫性を測定するために使用
テキスト埋め込み Transformers 韓国語
T
KDHyun08
24
2
Icefall Asr Gigaspeech Conformer Ctc
Icefallはk2フレームワークに基づく自動音声認識(ASR)ツールキットで、効率的で柔軟な音声認識モデルのトレーニングと推論に焦点を当てています。
音声認識 英語
I
speechcolab
0
0
Rgx Qa V2
このモデルはAFL-3.0ライセンスのもとでリリースされており、具体的な情報は現在利用できません。
大規模言語モデル Transformers
R
luohy
21
1
Wav2vec2 Large Ru Golos
Apache-2.0
facebook/wav2vec2-large-xlsr-53をファインチューニングしたロシア語音声認識モデル。Sberdevices Golosデータセットでトレーニングされ、16kHz音声入力をサポート
音声認識 Transformers その他
W
bond005
1,182
12
Efficientnet 61 Planet Detection
Apache-2.0
EfficientNetV2は、トレーニング速度とパラメータ効率を特に最適化した効率的な畳み込みニューラルネットワークアーキテクチャです。61チャンネル版はこのアーキテクチャのバリエーションです。
画像分類 Transformers
E
chlab
14
0
Cifar 10 Vgg Pretrained
PyTorchで実装された画像分類モデルで、さまざまな一般的な物体カテゴリを認識可能
画像分類 Transformers
C
amehta633
22
0
Umlsbert Ner
MIT
大規模言語モデル Transformers
U
RohanVB
22
6
Erlangshen Roberta 110M Sentiment
Apache-2.0
中国語RoBERTa-wwm-ext-baseモデルをベースに、複数の感情分析データセットでファインチューニングされたバージョン
テキスト分類 Transformers 中国語
E
IDEA-CCNL
16.19k
70
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase