Kolors
可図(Kolors)はKuaishou可図チームが独自開発した大規模テキストから画像生成の潜在拡散モデルで、生成画像の視覚品質、複雑な意味の再現度、中英文字体のレンダリングなどで優れた性能を発揮します。
ダウンロード数 1,546
リリース時間 : 6/5/2024
モデル概要
数十億規模の画像テキストペアで訓練された可図モデルは、中英入力に対応し、中国語特有のコンテンツの理解と生成に優れています。
モデル特徴
超リアルな画像生成
生成画像の視覚品質がオープンソース及びクローズドソースモデルを大幅に上回る
複雑な意味の再現
複雑な意味記述を正確に理解し再現できる
中英対応
中国語コンテンツの理解と生成能力を特別に最適化し、英語入力もサポート
文字体レンダリング能力
中英文字体のレンダリングで優れた性能を発揮
モデル能力
テキストから画像生成
高品質画像合成
複雑なシーン理解
中英テキストレンダリング
使用事例
クリエイティブデザイン
広告クリエイティブ生成
テキスト記述に基づき迅速に広告クリエイティブ画像を生成
高品質で意味に合致した画像出力
コンセプトアート創作
ゲーム、映画などのためのコンセプトアートデザインを提供
多様なスタイルの芸術作品
コンテンツ制作
ソーシャルメディアコンテンツ
ソーシャルメディアプラットフォーム向けの魅力的なビジュアルコンテンツを生成
高いエンゲージメントを得られるビジュアルコンテンツ
教育教材
教育分野向けのイラストや教材を生成
教育概念を正確に伝える画像
おすすめAIモデル
Llama 3 Typhoon V1.5x 8b Instruct
タイ語専用に設計された80億パラメータの命令モデルで、GPT-3.5-turboに匹敵する性能を持ち、アプリケーションシナリオ、検索拡張生成、制限付き生成、推論タスクを最適化
大規模言語モデル
Transformers 複数言語対応

L
scb10x
3,269
16
Cadet Tiny
Openrail
Cadet-TinyはSODAデータセットでトレーニングされた超小型対話モデルで、エッジデバイス推論向けに設計されており、体積はCosmo-3Bモデルの約2%です。
対話システム
Transformers 英語

C
ToddGoldfarb
2,691
6
Roberta Base Chinese Extractive Qa
RoBERTaアーキテクチャに基づく中国語抽出型QAモデルで、与えられたテキストから回答を抽出するタスクに適しています。
質問応答システム 中国語
R
uer
2,694
98