Gemma2b-Turkish-Instruction开源文本生成模型 - 支持土耳其语指令响应，训练数据丰富！

首页

Gemma2b Turkish Instruction

由 erythropygia 开发

基于Gemma-2b模型针对土耳其语指令-响应对进行微调的文本生成模型，支持约75k训练数据规模

大型语言模型

Transformers

其他#土耳其语指令微调 #轻量级生成模型 #LoRA高效训练

下载量 136

发布时间 : 3/5/2024

模型简介

该模型是Gemma-2b的土耳其语微调版本，专门优化了土耳其语指令理解和响应生成能力，适用于土耳其语对话和任务完成场景

模型特点

土耳其语优化

专门针对土耳其语指令-响应对进行微调，优化了土耳其语理解和生成能力

轻量化部署

支持4-bit量化部署，降低硬件需求

指令跟随

针对指令-响应格式优化，能更好地理解并执行用户指令

模型能力

土耳其语文本生成

指令理解与执行

代码生成（推断）

问答系统

使用案例

对话系统

土耳其语聊天机器人

构建能理解并响应土耳其语的对话系统

编程辅助

代码生成

根据土耳其语指令生成代码片段

🚀 Gemma2b土耳其语指令模型卡

本模型是使用土耳其语指令 - 响应对微调的Gemma - 2b模型，可用于文本生成任务。

🚀 快速开始

模型使用示例

以下是使用该模型进行文本生成的Python代码示例：

import torch,re
from transformers import AutoTokenizer, AutoModelForCausalLM, BitsAndBytesConfig

bnb_config = BitsAndBytesConfig(
    load_in_4bit=True,
    bnb_4bit_use_double_quant=True,
    bnb_4bit_quant_type="nf4",
    bnb_4bit_compute_dtype=torch.bfloat16
)

from transformers import AutoTokenizer, AutoModelForCausalLM

model_id = "erythropygia/Gemma2b-Turkish-Instruction"

model = AutoModelForCausalLM.from_pretrained(model_id, quantization_config=bnb_config, device_map={"":0})
tokenizer = AutoTokenizer.from_pretrained(model_id, add_eos_token=True, padding_side="left")

def get_completion(query: str, model, tokenizer) -> str:
  device = "cuda:0"

  prompt_template = """
  <start_of_turn>user
  Alt satırdaki soruya cevap ver:\n
  {query}
  <end_of_turn>\n<start_of_turn>model
  """
  prompt = prompt_template.format(query=query)

  encodeds = tokenizer(prompt, return_tensors="pt", add_special_tokens=True)

  model_inputs = encodeds.to(device)


  #max_new_tokens = 200, temperature = 0.9, repetition_penalty = 0.5,  disabled
  #num_return_sequences=1, max_length = 256,
  generated_ids = model.generate(**model_inputs, max_new_tokens = 256, do_sample=True, pad_token_id=tokenizer.eos_token_id)
  decoded = tokenizer.decode(generated_ids[0], skip_special_tokens=False)


  decoded = re.sub(r'<(end_of_turn|start_of_turn|eos|bos)>[^<]*$', '', decoded)

  decoded = re.sub(r'<(end_of_turn|start_of_turn|eos|bos)>', '', decoded)

  return decoded.strip()

result = get_completion(query="int türünde üç parametre alan ve bunların toplamını döndüren bir işlev oluşturun.", model=model, tokenizer=tokenizer)
print(result)