vntl-llama3-8b-v2-hfオープンソースモデル - 無料で日本語ビジュアルノベルの英訳最適化をサポート

ホーム

Vntl Llama3 8b V2 Hf

lmg-anonによって開発

LLaMA 3 Youkoを基にしたqloraファインチューニング版、日本語ビジュアルノベルの英訳に最適化

機械翻訳

Transformers

複数言語対応#日本語ビジュアルノベル翻訳 #直訳スタイル最適化 #複数行翻訳対応

ダウンロード数 145

リリース時間 : 1/1/2025

モデル概要

このモデルは日本語ビジュアルノベルを英語に翻訳するタスク向けに最適化された言語モデルで、新版VNTLデータセットで訓練され、翻訳精度と安定性が向上

モデル特徴

専門ビジュアルノベル翻訳

日本語ビジュアルノベルから英語への翻訳タスクに特化して最適化

複数行翻訳対応

複数行テキストを同時翻訳可能で、文脈の一貫性を保持

キャラクターメタデータ処理

キャラクターメタデータを認識・処理し、翻訳の一貫性を維持

直訳スタイル最適化

訳文は正確な直訳スタイルに偏り、意訳の偏りを低減

モデル能力

日本語から英語への翻訳

ビジュアルノベルテキスト処理

キャラクター会話翻訳

文脈認識翻訳

使用事例

ゲームローカライゼーション

ビジュアルノベル翻訳

日本語ビジュアルノベルを英語に翻訳

正確でキャラクター設定に沿った翻訳を提供

文学翻訳

対話形式文学翻訳

キャラクター対話を含む文学作品を翻訳

キャラクターの口調とスタイルの一貫性を保持

🚀 クイックスタート

このプロジェクトは、新しいバージョンのVNTLデータセットを使用して作成されたLLaMA 3 YoukoのQLoRAファインチューニングモデルです。主な目的は、日本語のビジュアルノベルを英語に翻訳する際の大規模言語モデル（LLM）の性能を向上させることです。

✨ 主な機能

前のバージョンとは異なり、「チャットモード」を含んでいません。
データセットを完全に再構築し拡張し、精度と安定性が向上しています。
LLaMA 3のデフォルトのプロンプト形式を採用しています。
複数行の翻訳に対応しています（旧バージョンは1行のみ対応）。
全体的な翻訳精度が向上しています。

📦 ライセンス

このモデルは、llama3ライセンスの下で提供されています。

📚 詳細ドキュメント

注意事項

この新しいVNTL 8Bのバージョンでは、VNTLのデータセットを完全に再構築し拡張しました。精度と安定性において前のバージョンを上回り、高温で実行しても誤りが少なくなります（ただし、最高の精度を得るには温度0を推奨します）。

このバージョンの主な変更点は以下の通りです：

カスタムのプロンプト形式で問題があったため、LLaMA 3のデフォルトのプロンプト形式に切り替えました
複数行の翻訳に対応しました（旧バージョンは1行のみ対応）
全体的な翻訳精度が向上しました

ただし、翻訳は前のバージョンよりも逐語的になる傾向があります。

サンプリングの推奨事項

このモデルを使用する際には、最適な結果を得るために中性的なサンプリングパラメータ（温度0で繰り返しペナルティなし）を使用することを強く推奨します。

学習の詳細

このファインチューニングは、前のバージョンと同様のハイパーパラメータを使用して行われました。唯一の違いは、データセットが全く新しいものであることです。

ランク: 128
アルファ: 32
有効バッチサイズ: 45
ウォームアップ率: 0.02
学習率: 6e-5
埋め込み学習率: 1e-5
オプティマイザ: grokadamw
学習率スケジュール: cosine
重み減衰: 0.01

学習損失: 0.42

翻訳のプロンプト

このファインチューニングはLLaMA 3のプロンプト形式を使用しています。以下は翻訳のプロンプトの例です：

<|begin_of_text|><|start_header_id|>Metadata<|end_header_id|>

[character] Name: Uryuu Shingo (瓜生 新吾) | Gender: Male | Aliases: Onii-chan (お兄ちゃん)
[character] Name: Uryuu Sakuno (瓜生 桜乃) | Gender: Female<|eot_id|><|start_header_id|>Japanese<|end_header_id|>

[桜乃]: 『……ごめん』<|eot_id|><|start_header_id|>English<|end_header_id|>

[Sakuno]: 『... Sorry.』<|eot_id|><|start_header_id|>Japanese<|end_header_id|>

[新吾]: 「ううん、こう言っちゃなんだけど、迷子でよかったよ。桜乃は可愛いから、いろいろ心配しちゃってたんだぞ俺」<|eot_id|><|start_header_id|>English<|end_header_id|>

[Shingo]: "Nah, I know it’s weird to say this, but I’m glad you got lost. You’re so cute, Sakuno, so I was really worried about you."<|eot_id|>

温度0でこのプロンプトから生成される翻訳は以下の通りです：

[Shingo]: "Nah, I know it’s weird to say this, but I’m glad you got lost. You’re so cute, Sakuno, so I was really worried about you."

豆知識

メタデータセクションはキャラクター情報に限定されず、豆知識を追加したり、モデルが苦手な単語の正しい発音を教えることもできます。

以下はその例です：

<|begin_of_text|><|start_header_id|>Metadata<|end_header_id|>

[character] Name: Uryuu Shingo (瓜生 新吾) | Gender: Male | Aliases: Onii-chan (お兄ちゃん)
[character] Name: Uryuu Sakuno (瓜生 桜乃) | Gender: Female
[element] Name: Murasamemaru (叢雨丸) | Type: Quality<|eot_id|><|start_header_id|>Japanese<|end_header_id|>

[桜乃]: 『……ごめん』<|eot_id|><|start_header_id|>English<|end_header_id|>

[Sakuno]: 『... Sorry.』<|eot_id|><|start_header_id|>Japanese<|end_header_id|>

[新吾]: 「ううん、こう言っちゃなんだけど、迷子でよかったよ。桜乃は叢雨丸いから、いろいろ心配しちゃってたんだぞ俺」<|eot_id|><|start_header_id|>English<|end_header_id|>

温度0でこのプロンプトから生成される翻訳は以下の通りです：

[Shingo]: "Nah, I know it’s not the best thing to say, but I’m glad you got lost. Sakuno’s Murasamemaru, so I was really worried about you, you know?"

属性	详情
モデルタイプ	LLaMA 3 YoukoのQLoRAファインチューニングモデル
学習データ	lmg-anon/VNTL-v5-1k
ライブラリ名	transformers
ベースモデル	rinna/llama-3-youko-8b
パイプラインタグ	翻訳