C

Cogview4 6B

THUDMによって開発
CogView4-6BはGLM-4-9Bベースモデルを基にしたテキスト生成画像モデルで、中国語と英語をサポートし、高品質な画像を生成できます。
ダウンロード数 333.85k
リリース時間 : 3/3/2025

モデル概要

CogView4-6Bは高性能なテキスト生成画像モデルで、テキストプロンプトに基づき高品質な画像を生成し、多様な解像度と複雑なテキスト記述をサポートします。

モデル特徴

高解像度サポート
512pxから2048pxまでの幅高さをサポートし、総ピクセル数は2^21ピクセルを超えません。
低VRAM最適化
モデルCPUオフロードとテキストエンコーダ4bit量子化技術により、VRAM使用量を大幅に削減。
中国語テキスト高精度
中国語テキスト精度評価でF1値0.6168を達成し、他モデルを大幅に上回ります。

モデル能力

テキストから画像生成
高解像度画像生成
多言語サポート(中国語、英語)

使用事例

クリエイティブデザイン
スポーツカー設計
詳細なテキスト記述に基づき高品質なスポーツカー画像を生成。
生成画像は高度なディテールとリアリティを持ち、テキスト記述の属性を正確に再現できます。
広告・マーケティング
製品展示
製品説明に基づき魅力的な製品展示画像を生成。
生成画像は製品の主要特性とセールスポイントを効果的に強調できます。
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase