vit-base-patch16-224-in21k-gpt2オープンソースモデル - ポケモンの特色ある説明を高精度に生成

ホーム

Vit Base Patch16 224 In21k Gpt2 Finetuned To Pokemon Descriptions

tkarrによって開発

ViTとGPT2アーキテクチャに基づく視覚-言語モデルで、ポケモン説明生成タスク向けに特別にファインチューニングされています

テキスト生成

Transformers

#ポケモン説明生成 #マルチモーダルファインチューニング #視覚-言語モデル

ダウンロード数 29

リリース時間 : 12/15/2022

モデル概要

このモデルは視覚Transformer(ViT)と生成的プレトレーニングTransformer(GPT2)の能力を組み合わせており、入力されたポケモン画像に基づいて対応する説明テキストを生成できます。

モデル特徴

マルチモーダル能力

視覚と言語処理能力を組み合わせ、画像内容を理解し関連するテキスト説明を生成可能

ドメイン特化

ポケモンドメイン向けに特別にファインチューニングされており、この領域で優れた性能を発揮

エンドツーエンド生成

中間処理ステップなしで、画像入力から直接一貫性のあるテキスト出力を生成

モデル能力

画像理解

テキスト生成

マルチモーダル推論

ドメイン固有説明生成

使用事例

ゲーム補助

ポケモン図鑑自動生成

ゲーム内のポケモンに対して自動的に記述テキストを生成

検証損失0.0756

教育応用

児童学習補助

画像認識を通じて子供たちがポケモンの特徴を学ぶのを支援

訓練損失	エポック	ステップ	検証損失
0.0847	1.0	802	0.0777
0.0781	2.0	1604	0.0756

おすすめAIモデル

Llama 3 Typhoon V1.5x 8b Instruct

タイ語専用に設計された80億パラメータの命令モデルで、GPT-3.5-turboに匹敵する性能を持ち、アプリケーションシナリオ、検索拡張生成、制限付き生成、推論タスクを最適化

Cadet-TinyはSODAデータセットでトレーニングされた超小型対話モデルで、エッジデバイス推論向けに設計されており、体積はCosmo-3Bモデルの約2％です。

Roberta Base Chinese Extractive Qa

RoBERTaアーキテクチャに基づく中国語抽出型QAモデルで、与えられたテキストから回答を抽出するタスクに適しています。

質問応答システム中国語

uer

2,694

未来を切り開く、あなたのAIソリューション知識ベース

English 简体中文繁體中文にほんご

Vit Base Patch16 224 In21k Gpt2 Finetuned To Pokemon Descriptions

モデル概要

モデル特徴

モデル能力

使用事例

🚀 vit-base-patch16-224-in21k-gpt2-finetuned-to-pokemon-descriptions

🚀 クイックスタート

🔧 技術詳細

訓練ハイパーパラメータ

訓練結果

フレームワークバージョン