🚀 基於LLaMA 3 Youko的日語視覺小說翻譯微調模型
本項目是一個基於 LLaMA 3 Youko 的QLoRA微調模型,使用新版VNTL數據集進行訓練。該微調的目的是提升大語言模型將日語視覺小說翻譯成英語的性能。與之前的版本不同,此版本不包含“聊天模式”。
🚀 快速開始
本微調模型使用LLaMA 3的提示格式,以下是一個翻譯提示示例:
<|begin_of_text|><|start_header_id|>Metadata<|end_header_id|>
[character] Name: Uryuu Shingo (瓜生 新吾) | Gender: Male | Aliases: Onii-chan (お兄ちゃん)
[character] Name: Uryuu Sakuno (瓜生 桜乃) | Gender: Female<|eot_id|><|start_header_id|>Japanese<|end_header_id|>
[桜乃]: 『……ごめん』<|eot_id|><|start_header_id|>English<|end_header_id|>
[Sakuno]: 『... Sorry.』<|eot_id|><|start_header_id|>Japanese<|end_header_id|>
[新吾]: 「ううん、こう言っちゃなんだけど、迷子でよかったよ。桜乃は可愛いから、いろいろ心配しちゃってたんだぞ俺」<|eot_id|><|start_header_id|>English<|end_header_id|>
[Shingo]: "Nah, I know it’s weird to say this, but I’m glad you got lost. You’re so cute, Sakuno, so I was really worried about you."<|eot_id|>
當溫度參數設置為0時,該提示生成的翻譯結果如下:
[Shingo]: "Nah, I know it’s weird to say this, but I’m glad you got lost. You’re so cute, Sakuno, so I was really worried about you."
✨ 主要特性
- 性能提升:與之前的版本相比,在準確性和穩定性方面表現更優,即使在高溫參數下運行,錯誤也大幅減少(不過為獲得最佳準確性,仍建議將溫度設置為0)。
- 格式調整:切換到默認的LLaMA 3提示格式,解決了自定義格式帶來的使用困擾。
- 多行支持:增加了對多行翻譯的支持,而舊版本僅能處理單行翻譯。
- 準確性增強:整體翻譯準確性更高,但與之前版本相比,翻譯結果更傾向於逐字翻譯。
📦 安裝指南
暫未提供相關安裝步驟。
💻 使用示例
基礎用法
<|begin_of_text|><|start_header_id|>Metadata<|end_header_id|>
[character] Name: Uryuu Shingo (瓜生 新吾) | Gender: Male | Aliases: Onii-chan (お兄ちゃん)
[character] Name: Uryuu Sakuno (瓜生 桜乃) | Gender: Female<|eot_id|><|start_header_id|>Japanese<|end_header_id|>
[桜乃]: 『……ごめん』<|eot_id|><|start_header_id|>English<|end_header_id|>
[Sakuno]: 『... Sorry.』<|eot_id|><|start_header_id|>Japanese<|end_header_id|>
[新吾]: 「ううん、こう言っちゃなんだけど、迷子でよかったよ。桜乃は可愛いから、いろいろ心配しちゃってたんだぞ俺」<|eot_id|><|start_header_id|>English<|end_header_id|>
[Shingo]: "Nah, I know it’s weird to say this, but I’m glad you got lost. You’re so cute, Sakuno, so I was really worried about you."<|eot_id|>
高級用法
在元數據部分不僅可以添加角色信息,還能添加瑣事信息,並教導模型正確發音較難的詞彙。以下是一個示例:
<|begin_of_text|><|start_header_id|>Metadata<|end_header_id|>
[character] Name: Uryuu Shingo (瓜生 新吾) | Gender: Male | Aliases: Onii-chan (お兄ちゃん)
[character] Name: Uryuu Sakuno (瓜生 桜乃) | Gender: Female
[element] Name: Murasamemaru (叢雨丸) | Type: Quality<|eot_id|><|start_header_id|>Japanese<|end_header_id|>
[桜乃]: 『……ごめん』<|eot_id|><|start_header_id|>English<|end_header_id|>
[Sakuno]: 『... Sorry.』<|eot_id|><|start_header_id|>Japanese<|end_header_id|>
[新吾]: 「ううん、こう言っちゃなんだけど、迷子でよかったよ。桜乃は叢雨丸いから、いろいろ心配しちゃってたんだぞ俺」<|eot_id|><|start_header_id|>English<|end_header_id|>
當溫度參數設置為0時,該提示生成的翻譯結果如下:
[Shingo]: "Nah, I know it’s not the best thing to say, but I’m glad you got lost. Sakuno’s Murasamemaru, so I was really worried about you, you know?"
📚 詳細文檔
採樣建議
為獲得最佳效果,強烈建議在使用此模型時採用中性採樣參數(溫度為0,無重複懲罰)。
訓練詳情
本次微調使用的超參數與 之前版本 相似,唯一的區別在於使用了全新的數據集。
屬性 |
詳情 |
模型類型 |
基於LLaMA 3 Youko的QLoRA微調模型 |
訓練數據 |
lmg-anon/VNTL-v5-1k |
秩(Rank) |
128 |
阿爾法(Alpha) |
32 |
有效批量大小 |
45 |
預熱比例 |
0.02 |
學習率 |
6e - 5 |
嵌入學習率 |
1e - 5 |
優化器 |
grokadamw |
學習率調度 |
餘弦 |
權重衰減 |
0.01 |
訓練損失 |
0.42 |
📄 許可證
本項目使用的許可證為llama3。