vntl-llama3-8b-v2-hf開源模型 - 免費助力日語視覺小說英譯優化

首頁

Vntl Llama3 8b V2 Hf

由lmg-anon開發

基於LLaMA 3 Youko的qlora微調版本，專為日語視覺小說英譯優化

機器翻譯

Transformers

支持多種語言#日語視覺小說翻譯 #直譯風格優化 #多行翻譯支持

下載量 145

發布時間 : 1/1/2025

模型概述

該模型是針對日語視覺小說翻譯為英語任務優化的語言模型，通過新版VNTL數據集訓練，提升了翻譯準確性和穩定性

模型特點

專業視覺小說翻譯

針對日語視覺小說到英語的翻譯任務特別優化

多行翻譯支持

支持同時翻譯多行文本，保持上下文連貫性

角色元數據處理

能夠識別和處理角色元數據，保持翻譯一致性

直譯風格優化

譯文更偏向準確直譯風格，減少意譯偏差

模型能力

日語到英語翻譯

視覺小說文本處理

角色對話翻譯

上下文感知翻譯

使用案例

遊戲本地化

視覺小說翻譯

將日語視覺小說翻譯為英語

提供準確且符合角色設定的翻譯

文學翻譯

對話體文學翻譯

翻譯包含角色對話的文學作品

保持角色語氣和風格的一致性

🚀 基於LLaMA 3 Youko的日語視覺小說翻譯微調模型

本項目是一個基於 LLaMA 3 Youko 的QLoRA微調模型，使用新版VNTL數據集進行訓練。該微調的目的是提升大語言模型將日語視覺小說翻譯成英語的性能。與之前的版本不同，此版本不包含“聊天模式”。

🚀 快速開始

本微調模型使用LLaMA 3的提示格式，以下是一個翻譯提示示例：

<|begin_of_text|><|start_header_id|>Metadata<|end_header_id|>

[character] Name: Uryuu Shingo (瓜生 新吾) | Gender: Male | Aliases: Onii-chan (お兄ちゃん)
[character] Name: Uryuu Sakuno (瓜生 桜乃) | Gender: Female<|eot_id|><|start_header_id|>Japanese<|end_header_id|>

[桜乃]: 『……ごめん』<|eot_id|><|start_header_id|>English<|end_header_id|>

[Sakuno]: 『... Sorry.』<|eot_id|><|start_header_id|>Japanese<|end_header_id|>

[新吾]: 「ううん、こう言っちゃなんだけど、迷子でよかったよ。桜乃は可愛いから、いろいろ心配しちゃってたんだぞ俺」<|eot_id|><|start_header_id|>English<|end_header_id|>

[Shingo]: "Nah, I know it’s weird to say this, but I’m glad you got lost. You’re so cute, Sakuno, so I was really worried about you."<|eot_id|>

當溫度參數設置為0時，該提示生成的翻譯結果如下：

[Shingo]: "Nah, I know it’s weird to say this, but I’m glad you got lost. You’re so cute, Sakuno, so I was really worried about you."

✨ 主要特性

性能提升：與之前的版本相比，在準確性和穩定性方面表現更優，即使在高溫參數下運行，錯誤也大幅減少（不過為獲得最佳準確性，仍建議將溫度設置為0）。
格式調整：切換到默認的LLaMA 3提示格式，解決了自定義格式帶來的使用困擾。
多行支持：增加了對多行翻譯的支持，而舊版本僅能處理單行翻譯。
準確性增強：整體翻譯準確性更高，但與之前版本相比，翻譯結果更傾向於逐字翻譯。

📦 安裝指南

暫未提供相關安裝步驟。

💻 使用示例

基礎用法

<|begin_of_text|><|start_header_id|>Metadata<|end_header_id|>

[character] Name: Uryuu Shingo (瓜生 新吾) | Gender: Male | Aliases: Onii-chan (お兄ちゃん)
[character] Name: Uryuu Sakuno (瓜生 桜乃) | Gender: Female<|eot_id|><|start_header_id|>Japanese<|end_header_id|>

[桜乃]: 『……ごめん』<|eot_id|><|start_header_id|>English<|end_header_id|>

[Sakuno]: 『... Sorry.』<|eot_id|><|start_header_id|>Japanese<|end_header_id|>

[新吾]: 「ううん、こう言っちゃなんだけど、迷子でよかったよ。桜乃は可愛いから、いろいろ心配しちゃってたんだぞ俺」<|eot_id|><|start_header_id|>English<|end_header_id|>

[Shingo]: "Nah, I know it’s weird to say this, but I’m glad you got lost. You’re so cute, Sakuno, so I was really worried about you."<|eot_id|>

高級用法

在元數據部分不僅可以添加角色信息，還能添加瑣事信息，並教導模型正確發音較難的詞彙。以下是一個示例：

<|begin_of_text|><|start_header_id|>Metadata<|end_header_id|>

[character] Name: Uryuu Shingo (瓜生 新吾) | Gender: Male | Aliases: Onii-chan (お兄ちゃん)
[character] Name: Uryuu Sakuno (瓜生 桜乃) | Gender: Female
[element] Name: Murasamemaru (叢雨丸) | Type: Quality<|eot_id|><|start_header_id|>Japanese<|end_header_id|>

[桜乃]: 『……ごめん』<|eot_id|><|start_header_id|>English<|end_header_id|>

[Sakuno]: 『... Sorry.』<|eot_id|><|start_header_id|>Japanese<|end_header_id|>

[新吾]: 「ううん、こう言っちゃなんだけど、迷子でよかったよ。桜乃は叢雨丸いから、いろいろ心配しちゃってたんだぞ俺」<|eot_id|><|start_header_id|>English<|end_header_id|>

當溫度參數設置為0時，該提示生成的翻譯結果如下：

[Shingo]: "Nah, I know it’s not the best thing to say, but I’m glad you got lost. Sakuno’s Murasamemaru, so I was really worried about you, you know?"

📚 詳細文檔

採樣建議

為獲得最佳效果，強烈建議在使用此模型時採用中性採樣參數（溫度為0，無重複懲罰）。

訓練詳情

本次微調使用的超參數與之前版本相似，唯一的區別在於使用了全新的數據集。

屬性	詳情
模型類型	基於LLaMA 3 Youko的QLoRA微調模型
訓練數據	lmg-anon/VNTL-v5-1k
秩（Rank）	128
阿爾法（Alpha）	32
有效批量大小	45
預熱比例	0.02
學習率	6e - 5
嵌入學習率	1e - 5
優化器	grokadamw
學習率調度	餘弦
權重衰減	0.01
訓練損失	0.42