Denoising Diffusion Implicit Models
U-Netアーキテクチャに基づく簡易版拡散モデルで、画像のノイズ除去と生成の教育デモ用
ダウンロード数 77
リリース時間 : 6/29/2022
モデル概要
このモデルはU-Netアーキテクチャを用いてノイズ除去拡散プロセスを実装し、プログレッシブなダウンサンプリングとアップサンプリングで画像を処理、ガウシアンノイズから反復的に自然画像を生成可能。主に生成モデルの入門教育用。
モデル特徴
簡素化アーキテクチャ設計
標準DDPMモデルと比べて注意力層を除去し、畳み込み残差ブロックのみ保持、計算複雑性を低減
正弦波位置エンコーディング
ノイズ成分の分散に正弦波位置埋め込みを採用し、時系列情報を効果的に捕捉
教育向け親和性
適度な計算要件と明確なコード構造で、拡散モデルの入門学習に最適
モデル能力
画像ノイズ除去
無条件画像生成
プログレッシブ画像合成
使用事例
教育デモ
拡散モデル教育
拡散モデルの基本動作原理と訓練プロセスを展示
64x64解像度の花卉画像を生成
クリエイティブ生成
簡易画像生成
ランダムノイズから花卉類の画像を生成
品質が許容範囲の自然画像サンプル
おすすめAIモデル
Llama 3 Typhoon V1.5x 8b Instruct
タイ語専用に設計された80億パラメータの命令モデルで、GPT-3.5-turboに匹敵する性能を持ち、アプリケーションシナリオ、検索拡張生成、制限付き生成、推論タスクを最適化
大規模言語モデル
Transformers 複数言語対応

L
scb10x
3,269
16
Cadet Tiny
Openrail
Cadet-TinyはSODAデータセットでトレーニングされた超小型対話モデルで、エッジデバイス推論向けに設計されており、体積はCosmo-3Bモデルの約2%です。
対話システム
Transformers 英語

C
ToddGoldfarb
2,691
6
Roberta Base Chinese Extractive Qa
RoBERTaアーキテクチャに基づく中国語抽出型QAモデルで、与えられたテキストから回答を抽出するタスクに適しています。
質問応答システム 中国語
R
uer
2,694
98