Vox2オープンソースのピクセルスタイル画像生成モデル - 無料でデプロイ可能、顔の細部表現を精密に最適化

ホーム

Vox2

plasmoによって開発

これはStable Diffusionベースのピクセル風画像生成モデルで、184枚のトレーニング画像と8000回のトレーニングステップで作成され、特に顔のディテール表現が最適化されています。

画像生成オープンソースライセンス:Openrail #ピクセルアート生成 #有名人ピクセル化 #半写実的ディテール最適化

ダウンロード数 136.87k

リリース時間 : 11/25/2022

モデル概要

このモデルはピクセルスタイルの画像生成に特化しており、ゲーム開発やデジタルアート制作などのシーンに特に適しています。

モデル特徴

最適化された顔のディテール

v1.2バージョンでは特に顔のディテール表現が最適化され、より精細なピクセルスタイルの人物顔を生成できます。

AIアーティスト設計のトレーニングテキスト

20%のトレーニングテキストはAIアーティストJak_TheAI_Artistによって慎重に設計され、生成品質が向上しました。

スタイル変換能力

プロンプトに'精細なディテール'を追加することで半写実スタイルの画像を生成し、スタイル変換を実現できます。

モデル能力

テキストから画像生成

ピクセルスタイル変換

顔のディテール最適化

使用事例

デジタルアート制作

ピクセルスタイル肖像

有名人やオリジナルキャラクターのピクセルスタイル肖像を生成

サンプル画像に示されているようなピクセルスタイルの有名人肖像

ゲーム開発

ゲームキャラクターデザイン

ゲームキャラクターのピクセルスタイル素材を迅速に生成

おすすめAIモデル

Llama 3 Typhoon V1.5x 8b Instruct

タイ語専用に設計された80億パラメータの命令モデルで、GPT-3.5-turboに匹敵する性能を持ち、アプリケーションシナリオ、検索拡張生成、制限付き生成、推論タスクを最適化

Cadet-TinyはSODAデータセットでトレーニングされた超小型対話モデルで、エッジデバイス推論向けに設計されており、体積はCosmo-3Bモデルの約2％です。

Roberta Base Chinese Extractive Qa

RoBERTaアーキテクチャに基づく中国語抽出型QAモデルで、与えられたテキストから回答を抽出するタスクに適しています。

質問応答システム中国語

uer

2,694

未来を切り開く、あなたのAIソリューション知識ベース

English 简体中文繁體中文にほんご

Vox2

モデル概要

モデル特徴

モデル能力

使用事例

🚀 Stable Diffusion用Jak's Voxel-ish Image Pack v.1.2

🚀 クイックスタート

✨ 主な機能

💡 使用例

基本的な使用法

高度な使用法

📄 ライセンス

サンプル画像

voxel-ish