🚀 DanTagGen - 測試版
DanTagGen(Danbooru標籤生成器)的靈感源自p1atdev的Dart項目。但它採用了不同的架構、數據集、格式和訓練策略。
🚀 快速開始
DanTagGen是一個文本生成模型,旨在為Danbooru風格的圖像生成更豐富的標籤。它有不同的版本,每個版本在性能和能力上有所差異。
✨ 主要特性
- 不同版本,各有優勢:
- Alpha版:在200萬數據集上進行預訓練,批量大小較小,能力有限。
- Beta版:在530萬數據集上進行預訓練,批量大小更大,性能更穩定,在信息較少的情況下表現更佳。
- 可用於多種推理接口:基於4億參數的LLaMA架構從頭開始訓練,理論上可用於任何LLaMA推理接口。
- 提供多種模型格式:提供轉換後的FP16 gguf模型和量化的8位/6位gguf模型。
📦 安裝指南
文檔未提及具體安裝步驟,暫不提供。
💻 使用示例
基礎用法
以下是一個基本的提示示例:
1girl,
vivlos \(umamusume\), umamusume,
kxl-delta-style1,
swimsuit,
masterpiece, newest, absurdres, sensitive
示例1:Vivlos
|
無DTG |
DTG-Alpha |
DTG-Beta |
提示詞 |
基礎提示詞 |
基礎提示詞 + "mole under eye, tail, twintails, open mouth, single ear cover, horse ears, breasts, looking at viewer, visor cap, streaked hair, long hair, horse tail, hair between eyes, cowboy shot, blue nails, purple eyes, covered navel, horse girl, competition swimsuit, blush, multicolored hair, collarbone, two-tone swimsuit, animal ears, mole, white hair, ear covers, smile, ear ornament, swimsuit, solo, blue eyes, brown hair, one-piece swimsuit, white headwear, medium breasts, white one-piece swimsuit, bare shoulders," |
基礎提示詞 + "blue bikini, tail, twintails, single ear cover, horse ears, striped clothes, ear piercing, cleavage, breasts, blue ribbon, looking at viewer, ribbon, streaked hair, long hair, horse tail, hair between eyes, :3, purple eyes, horse girl, blush, multicolored hair, hair ribbon, collarbone, bikini skirt, piercing, animal ears, striped bikini, sitting, white hair, ear covers, :d, smile, swimsuit, solo, brown hair, ocean, white headwear, medium breasts, bikini," |
結果圖像 |
 |
 |
 |
性能 |
甚至無法生成Vivlos的圖像 |
可以生成具有正確角色特徵的圖像,但細節不足,部分特徵有誤或缺失 |
遠優於Alpha版,能提供良好的角色特徵,更多細節和更好的構圖 |
示例2:Daring Tact
基礎提示詞:
1girl,
daring tact \(umamusume\), umamusume,
kxl-delta-style1,
horse girl, horse tail, horse ears, cafe, table, chair,
masterpiece, newest, absurdres, safe
|
無DTG |
DTG-Alpha |
DTG-Beta |
提示詞 |
基礎提示詞 |
基礎提示詞 + "plant, necktie, tail, indoors, skirt, looking at viewer, cup, lounge chair, green theme, book, alternate costume, potted plant, hair ornament, blue jacket, blush, medium hair, black necktie, green eyes, jacket, animal ears, black hair, round eyewear, bookshelf, adjusting eyewear, ahoge, smile, solo, window, brown hair, crossed legs, glasses, closed mouth, book stack," |
基礎提示詞 + "jacket, sitting on table, food, tail, collar, horse racing, black hair, boots, school bag, bag, full body, blue eyes, hair ornament, animal ears, ahoge, sitting, thighhighs, blurry background, looking at viewer, school uniform, long hair, blurry, cup, window, crossed legs, alternate costume, medium breasts, breasts, calendar (object), casual, door, solo, disposable cup," |
結果圖像 |
 |
 |
 |
性能 |
|
可以生成具有更多元素和細節的圖像,但與角色的連貫性不佳 |
遠優於Alpha版,能提供更多細節和更好的構圖 |
高級用法
以下是輸入格式的代碼示例:
prompt = f"""
rating: {rating or '<|empty|>'}
artist: {artist.strip() or '<|empty|>'}
characters: {characters.strip() or '<|empty|>'}
copyrights: {copyrights.strip() or '<|empty|>'}
aspect ratio: {f"{aspect_ratio:.1f}" or '<|empty|>'}
target: {'<|' + target + '|>' if target else '<|long|>'}
general: {", ".join(special_tags)}, {general.strip().strip(",")}<|input_end|>
"""
例如:
rating: safe
artist: <|empty|>
characters: <|empty|>
copyrights: <|empty|>
aspect ratio: 1.0
target: <|short|>
general: 1girl, solo, dragon girl, dragon horns, dragon tail<|input_end|>
你可能會得到類似如下的輸出:
rating: safe
artist: <|empty|>
characters: <|empty|>
copyrights: <|empty|>
aspect ratio: 1.0
target: <|short|>
general: 1girl, solo, dragon girl, dragon horns, dragon tail<|input_end|>open mouth, red eyes, long hair, pointy ears, tail, black hair, chinese clothes, simple background, dragon, hair between eyes, horns, china dress, dress, looking at viewer, breasts
📚 詳細文檔
模型架構
此版本的DTG基於4億參數的LLaMA架構(個人偏好稱之為NanoLLaMA)從頭開始訓練。由於採用了LLaMA架構,理論上它可以用於任何LLaMA推理接口。
本倉庫還提供了轉換後的FP16 gguf模型和量化的8位/6位gguf模型。建議使用llama.cpp或llama-cpp-python來運行該模型,這樣會非常快速。
數據集和訓練
使用在HakuPhi中實現的訓練器進行訓練,在530萬數據上進行10個週期的訓練。該模型大約處理了60 - 120億個標記。
數據集由HakuBooru從Danbooru的SQLite數據庫中導出,使用每個評級下的收藏計數百分位數來過濾數據(200萬 = 前25%,530萬 = 前75%)。
工具
正在為該項目實現一個Gradio UI,其他開發者可以利用其中的API來開發不同的應用程序。還計劃開發sd-webui擴展。
🔧 技術細節
文檔未提供具體的技術實現細節,暫不展示。
📄 許可證
本項目採用OpenRail許可證。
屬性 |
詳情 |
模型類型 |
文本生成模型 |
訓練數據 |
從Danbooru的SQLite數據庫導出的數據集,使用收藏計數百分位數過濾,在530萬數據上訓練10個週期 |
⚠️ 重要提示
該模型標籤包含不適合所有受眾的內容。
💡 使用建議
建議使用llama.cpp或llama-cpp-python來運行該模型,以獲得更快的推理速度。