Gemma 3n E4B It Litert Preview GGUF
Gemma-3n-E4B-it-litert-previewはGoogleのGemma 3nモデルを微調整したバージョンで、画像とテキスト入力をサポートし、テキスト出力を生成し、マルチモーダルタスクに適しています。
画像生成テキスト
Transformers 英語

G
unsloth
134
1
Mistral Small 3.2 24B Instruct 2506 GGUF
Apache-2.0
Mistral Small 3.2 24B Instruct 2506は多言語大規模言語モデルで、テキストと画像の入力、テキストの出力をサポートし、128kのコンテキスト長を持っています。
画像生成テキスト 複数言語対応
M
lmstudio-community
5,588
1
Gemma 3n E2B It
Gemma 3nはGoogleが開発した軽量で最先端のオープンソースのマルチモーダルモデルファミリーで、Geminiモデルと同じ研究と技術に基づいて構築されています。テキスト、オーディオ、ビジュアル入力をサポートし、様々なタスクに適用できます。
画像生成テキスト
Transformers

G
google
1,183
26
Qwen2.5 Omni 7B GGUF
その他
Qwen2.5-Omni-7B-GGUF は Qwen2.5-Omni-7B モデルの GGUF フォーマット版で、テキスト、音声、画像を含むマルチモーダル入力をサポートします。
大規模言語モデル 英語
Q
ggml-org
319
3
Qwen2.5 Omni 3B GGUF
その他
Qwen2.5-Omni-3Bはマルチモーダルモデルで、テキスト、音声、画像の入力をサポートしますが、動画入力と音声生成はサポートしていません。
大規模言語モデル 英語
Q
ggml-org
126
1
DAM 3B Video
その他
DAM-3B-Videoは30億パラメータの視覚言語モデルで、ユーザーが指定した画像/動画領域に対して詳細な局所記述を生成できます。
画像生成テキスト
Safetensors 英語
D
nvidia
426
42
Llama 4 Tiny Random
これは軽量級のランダム初期化されたテキスト生成モデルで、Llama - 4 - Maverick - 17B - 128E - Instructの設定を調整して作成され、主にデバッグ目的で使用されます。
画像生成テキスト
Transformers

L
yujiepan
1,952
0
Gemma 3 12b Pt Qat Q4 0 Gguf
Gemma 3はGoogleが提供する軽量オープンソースのマルチモーダルモデルで、テキストと画像の入力に対応しテキストを生成可能、128Kの超長文コンテキストウィンドウと140以上の言語をサポートしています。
画像生成テキスト
G
google
475
12
Ola Video
Apache-2.0
Ola-7Bは、テンセント、清華大学、南洋理工大学が共同開発したマルチモーダル言語モデルで、Qwen2.5アーキテクチャを基に、テキスト、画像、動画、音声の入力をサポートし、テキストコンテンツを出力します。
複数言語対応
O
THUdyh
82
1
Stable Diffusion 3.5 Large Controlnet Canny
その他
Stable Diffusion 3.5大規模モデルに適応したCannyエッジ検出制御ネットワークで、画像生成プロセスを精密に制御
画像生成 英語
S
stabilityai
737
10
LTX Video
その他
DiTベースの初の動画生成モデルで、高品質な動画をリアルタイムに生成可能。テキストから動画、画像+テキストから動画の2つのシナリオに対応。
テキスト生成ビデオ 英語
L
Lightricks
165.42k
1,174
3dtopia XL
Apache-2.0
3DTopia-XLはPrimXの効率的な3D表現を基にした拡散Transformerアーキテクチャで、高品質な3Dアセットを迅速に生成可能
3Dビジョン
3
FrozenBurning
129
45
Sam2 Hiera Base Plus
Apache-2.0
SAM 2はFAIRが開発した画像とビデオのプロンプト可能な視覚セグメンテーションのための基盤モデルで、効率的なセグメンテーションをサポートします。
画像セグメンテーション
S
facebook
18.17k
6
Diva Llama 3 V0 8b
DiVA Llama 3はエンドツーエンドの音声アシスタントモデルで、音声とテキスト入力を処理でき、蒸留損失を用いてトレーニングされています。
テキスト生成オーディオ
Transformers

D
WillHeld
2,596
34
おすすめAIモデル
Llama 3 Typhoon V1.5x 8b Instruct
タイ語専用に設計された80億パラメータの命令モデルで、GPT-3.5-turboに匹敵する性能を持ち、アプリケーションシナリオ、検索拡張生成、制限付き生成、推論タスクを最適化
大規模言語モデル
Transformers 複数言語対応

L
scb10x
3,269
16
Cadet Tiny
Openrail
Cadet-TinyはSODAデータセットでトレーニングされた超小型対話モデルで、エッジデバイス推論向けに設計されており、体積はCosmo-3Bモデルの約2%です。
対話システム
Transformers 英語

C
ToddGoldfarb
2,691
6
Roberta Base Chinese Extractive Qa
RoBERTaアーキテクチャに基づく中国語抽出型QAモデルで、与えられたテキストから回答を抽出するタスクに適しています。
質問応答システム 中国語
R
uer
2,694
98