Flux Kontext InScene
F
Flux Kontext InScene
peteromalletによって開発
InSceneは、Flux.Kontext.dev用のLoRAモデルで、ソース画像とシーンが一致する画像を生成することを目的としています。
ダウンロード数 1,343
リリース時間 : 7/18/2025
モデル概要
このモデルは、背景、全体的な環境、人物、スタイルを維持したまま、特定のレンズの異なるバージョンを生成することができ、画像生成タスクに新しい解決策を提供します。
モデル特徴
シーンの一致性
元のシーンと一致するリアルなレンズを生成し、背景、環境、スタイルを維持します。
多スタイル対応
ほとんどの一般的な撮影およびアートスタイルを処理できます。
特定レンズ生成
特定のレンズの異なるバージョン(近接特写など)を生成することができます。
モデル能力
画像生成
シーンの一致性維持
多スタイル画像処理
使用事例
画像生成
自動車の特写生成
元のシーンと一致する自動車の近接特写レンズを生成します。
背景とスタイルを維持した自動車の特写画像
人物の表情変化
同じシーンで人物の異なる表情のバージョンを生成します。
環境とスタイルを維持した人物の表情変化画像
おすすめAIモデル
Qwen2.5 VL 7B Abliterated Caption It I1 GGUF
Apache-2.0
Qwen2.5-VL-7B-Abliterated-Caption-itの量子化バージョンで、多言語画像記述タスクをサポートします。
画像生成テキスト
Transformers 複数言語対応

Q
mradermacher
167
1
Nunchaku Flux.1 Dev Colossus
その他
Colossus Project FluxのNunchaku量子化バージョンで、テキストプロンプトに基づいて高品質な画像を生成することを目的としています。このモデルは、推論効率を最適化しながら、性能損失を最小限に抑えます。
画像生成 英語
N
nunchaku-tech
235
3
Qwen2.5 VL 7B Abliterated Caption It GGUF
Apache-2.0
これはQwen2.5-VL-7Bモデルに基づく静的量子化バージョンで、画像記述生成タスクに特化し、複数の言語をサポートしています。
画像生成テキスト
Transformers 複数言語対応

Q
mradermacher
133
1
Olmocr 7B 0725 FP8
Apache-2.0
olmOCR-7B-0725-FP8は、Qwen2.5-VL-7B-Instructモデルをベースに、olmOCR-mix-0225データセットで微調整した後、FP8バージョンに量子化した文書OCRモデルです。
画像生成テキスト
Transformers 英語

O
allenai
881
3
Lucy 128k GGUF
Apache-2.0
Lucy-128kはQwen3 - 1.7Bをベースに開発された、プロキシ型ネットワーク検索と軽量ブラウジングに特化したモデルで、モバイルデバイスでも効率的に動作します。
大規模言語モデル
Transformers 英語

L
Mungert
263
2