S

Smolvlm 500M Anime Caption V0.1

由Andres77872開發
專注於描述動漫風格圖像的視覺語言模型,基於SmolVLM-500M-Base微調,訓練數據包含18萬組由大語言模型生成的合成圖像/字幕對。
下載量 61
發布時間 : 4/18/2025

模型概述

專為高效生成高質量的動漫風格圖像字幕而設計,能為各類動漫作品和插畫生成自然流暢的英文描述。

模型特點

動漫圖像專用
專門針對動漫風格圖像優化,能準確捕捉動漫特有的視覺特徵和風格元素。
高質量合成數據訓練
使用最新大語言模型(Gemma 3、Gemini 2.0 Flash等)生成的18萬組高質量合成數據訓練。
輕量高效
基於500M參數的輕量級模型,在保持性能的同時實現高效推理。

模型能力

動漫圖像描述生成
動漫內容索引與標記
動漫風格識別

使用案例

動漫內容創作
動漫作品自動字幕
為動漫作品和插畫自動生成英文描述字幕
自然流暢的動漫風格描述
動漫資料庫標註
用於動漫資料庫和數據庫的內容自動標註
提高內容檢索效率
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase