S

Smolvlm 500M Anime Caption V0.1

Andres77872によって開発
アニメスタイル画像の記述に特化した視覚言語モデル。SmolVLM-500M-Baseをファインチューニングし、大規模言語モデルで生成された18万組の合成画像/字幕ペアでトレーニング。
ダウンロード数 61
リリース時間 : 4/18/2025

モデル概要

高品質なアニメスタイル画像字幕を効率的に生成するために設計されており、様々なアニメ作品やイラストに対して自然で流暢な英語記述を生成可能。

モデル特徴

アニメ画像専用
アニメスタイル画像に最適化されており、アニメ特有の視覚的特徴やスタイル要素を正確に捉える。
高品質合成データトレーニング
最新の大規模言語モデル(Gemma 3、Gemini 2.0 Flashなど)で生成された18万組の高品質合成データでトレーニング。
軽量で効率的
500Mパラメータの軽量モデルで、性能を維持しながら効率的な推論を実現。

モデル能力

アニメ画像記述生成
アニメコンテンツ索引とタグ付け
アニメスタイル認識

使用事例

アニメコンテンツ制作
アニメ作品自動字幕
アニメ作品やイラストに自動的に英語字幕を生成
自然で流暢なアニメスタイル記述
アニメデータベースタグ付け
アニメデータベースやライブラリのコンテンツ自動タグ付けに使用
コンテンツ検索効率向上
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase