# 低遅延生成

Kimi Audio 7B Instruct
MIT
キミオーディオは、音声理解、生成、対話において優れた性能を発揮するオープンソースの音声基盤モデルで、様々な音声処理タスクをサポートします。
音声認識 Safetensors 複数言語対応
K
moonshotai
1,626
182
Hidream I1 Fast
MIT
HiDream-I1は170億パラメータを持つオープンソースの画像生成基盤モデルで、数秒で業界トップレベルの画像生成品質を実現します。
画像生成 英語
H
HiDream-ai
53.66k
73
Elastic Mistral 7B Instruct V0.3
Apache-2.0
Mistral-7B-Instruct-v0.3はMistral-7Bベースの命令チューニングモデルで、多言語テキスト生成タスクをサポートします。
大規模言語モデル
E
TheStageAI
68
3
Phi 4 Mini Instruct Abliterated
MIT
Phi-4-mini-instructは合成データと精選された公開ウェブサイトに基づいて構築された軽量オープンソースモデルで、高品質で強力な推論能力を持つデータに焦点を当てています。128Kトークンのコンテキスト長をサポートし、教師あり微調整と直接選好最適化により、正確な命令追従と安全性を確保しています。
大規模言語モデル Transformers 複数言語対応
P
lunahr
250
8
Phi 3 Medium 4k Instruct
MIT
Phi-3-Medium-4K-Instructは140億パラメータの軽量オープンソースモデルで、高品質な推論能力に特化し、4Kのコンテキスト長をサポート、英語環境での商業・研究用途に適しています。
大規模言語モデル Transformers その他
P
microsoft
43.60k
219
Seamless M4t V2 Large
SeamlessM4Tは大規模な多言語マルチモーダル機械翻訳モデルで、約100言語の音声とテキスト翻訳をサポートしています。
テキスト生成オーディオ 複数言語対応
S
audo
39
17
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase