# 多シーン対応

Deepseek R1 Distill Qwen 14B Japanese
MIT
このモデルは、人工知能技術が社会の各分野に与える影響と変革のトレンドを分析するために使用されます
大規模言語モデル Safetensors 日本語
D
cyberagent
7,155
83
MMS TTS THAI FEMALEV1
これはタイ語女性音声のテキスト読み上げ(TTS)モデルで、VITSアーキテクチャを微調整しており、高品質なタイ語音声合成をサポートします。
音声合成 Safetensors その他
M
VIZINTZOR
81
2
Base ZhEn
このモデルは画像の内容をテキスト説明に変換するために使用され、非商用目的に適しています。
文字認識
B
MixTex
50
0
Distilvit
Apache-2.0
VIT画像エンコーダーと蒸留版GPT-2テキストデコーダーを基にした視覚言語モデルで、画像説明生成タスクに使用
画像生成テキスト Transformers
D
Mozilla
290
19
Parrots Chinese Hubert Base
Apache-2.0
中国語HuBERT基本モデルは、テキスト読み上げタスク用の事前学習モデルで、中国語音声処理をサポートします。
音声合成 Transformers 中国語
P
shibing624
35
1
Invoice Parser
Apache-2.0
Apache-2.0ライセンスに基づく画像テキスト変換モデルで、画像内容を正確にテキスト記述に変換できます。
画像生成テキスト Transformers
I
purna419
95
7
Codeexecutor
MIT
このモデルはMITライセンスで公開されており、具体的な情報は現在利用できません。
大規模言語モデル Transformers
C
microsoft
26
15
Codexmd
MIT
大規模言語モデル Transformers
C
Gouletf
126
1
Xls R 300m Bart Base
Apache-2.0
これはApache-2.0ライセンスを使用するオープンソースモデルで、具体的な情報は追加が必要です
大規模言語モデル Transformers
X
anton-l
19
0
Image Captioning Portuguese
Apache-2.0
これは画像をポルトガル語の説明に変換できるモデルで、ViTとGPT2アーキテクチャで訓練されています。
画像生成テキスト その他
I
adalbertojunior
17
1
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase