Gugugo-koen-7B-V1.1開源韓英互譯模型 - 免費實現韓語英語高質量翻譯

首頁

Gugugo Koen 7B V1.1

由squarelike開發

Gugugo-koen-7B-V1.1 是一個基於 Llama-2-ko-7b 的韓英互譯模型，專門用於韓語和英語之間的高質量翻譯任務。

機器翻譯

Transformers

支持多種語言開源協議:Apache-2.0 #韓英互譯 #低資源訓練 #多格式支持

下載量 94

發布時間 : 10/27/2023

模型概述

該模型專注於韓語和英語之間的雙向翻譯，適用於需要高質量翻譯的各種應用場景。

模型特點

高質量翻譯

專注於韓語和英語之間的高質量雙向翻譯。

多格式支持

支持 GPTQ、AWQ 和 GGUF 格式，便於不同環境下的部署和使用。

高效訓練

使用1塊A6000 GPU訓練了90小時，優化了訓練效率。

模型能力

韓語到英語翻譯

英語到韓語翻譯

使用案例

語言翻譯

韓英互譯

將韓語文本翻譯為英語，或將英語文本翻譯為韓語。

高質量的翻譯輸出，適用於文檔、對話等多種場景。

🚀 Gugugo-koen-7B-V1.1

Gugugo-koen-7B-V1.1是一個專注於韓語和英語翻譯任務的模型，基於Llama-2-ko-7b基礎模型，使用特定數據集訓練而來，支持多種量化格式。

🚀 快速開始

詳細倉庫：https://github.com/jwj7140/Gugugo

✨ 主要特性

基礎模型：Llama-2-ko-7b
訓練數據集：sharegpt_deepl_ko_translation
訓練資源：使用1張A6000 GPU訓練90小時
量化支持：支持GPTQ、AWQ和GGUF格式

📚 詳細文檔

提示模板

韓語到英語

### 한국어: {sentence}</끝>
### 영어:

英語到韓語

### 영어: {sentence}</끝>
### 한국어:

💻 使用示例

基礎用法

from transformers import AutoModelForCausalLM, AutoTokenizer, StoppingCriteria, StoppingCriteriaList
import torch
repo = "squarelike/Gugugo-koen-7B-V1.1"
model = AutoModelForCausalLM.from_pretrained(
        repo,
        load_in_4bit=True,
        device_map='auto'
)
tokenizer = AutoTokenizer.from_pretrained(repo)

class StoppingCriteriaSub(StoppingCriteria):
    def __init__(self, stops = [], encounters=1):
        super().__init__()
        self.stops = [stop for stop in stops]

    def __call__(self, input_ids: torch.LongTensor, scores: torch.FloatTensor):
        for stop in self.stops:
            if torch.all((stop == input_ids[0][-len(stop):])).item():
                return True

        return False

stop_words_ids = torch.tensor([[829, 45107, 29958], [1533, 45107, 29958], [829, 45107, 29958], [21106, 45107, 29958]]).to("cuda")
stopping_criteria = StoppingCriteriaList([StoppingCriteriaSub(stops=stop_words_ids)])

def gen(lan="en", x=""):
    if (lan == "ko"):
        prompt = f"### 한국어: {x}</끝>\n### 영어:"
    else:
        prompt = f"### 영어: {x}</끝>\n### 한국어:"
    gened = model.generate(
        **tokenizer(
            prompt,
            return_tensors='pt',
            return_token_type_ids=False
        ).to("cuda"),
        max_new_tokens=2000,
        temperature=0.3,
        # no_repeat_ngram_size=5,
        num_beams=5,
        stopping_criteria=stopping_criteria
    )
    return tokenizer.decode(gened[0][1:]).replace(prompt+" ", "").replace("</끝>", "")


print(gen(lan="en", x="Hello, world!"))