llama-2-70b-fb16-korean開源模型 - 免費支持韓語和英語文本生成

首頁

Llama 2 70b Fb16 Korean

由quantumaikr開發

基於Llama2 70B模型在韓語數據集上微調的版本，專注於韓語和英語的文本生成任務

大型語言模型

Transformers

支持多種語言#韓語優化 #大參數模型 #指令跟隨

下載量 127

發布時間 : 8/11/2023

模型概述

這是一個經過韓語數據集微調的大型語言模型，能夠出色地遵循指令並提供幫助，特別適合韓語和英語的文本生成任務

模型特點

韓語優化

專門針對韓語進行了微調，提供更自然的韓語文本生成能力

大容量模型

基於70B參數的Llama2架構，具備強大的語言理解和生成能力

多語言支持

同時支持韓語和英語的文本生成

指令跟隨

能夠出色地理解和遵循用戶指令

模型能力

韓語文本生成

英語文本生成

指令理解與執行

對話系統構建

使用案例

智能助手

韓語問答系統

構建能夠理解並回答韓語問題的智能助手

提供準確、自然的韓語回答

內容創作

韓語內容生成

自動生成韓語文章、報告或其他文本內容

生成流暢、符合語境的韓語文本

🚀 quantumaikr/llama-2-70b-fb16-korean

quantumaikr/llama-2-70b-fb16-korean 是一個基於Llama2 70B模型，針對韓語數據集進行微調的模型，可用於文本生成。

KoreanLM icon

🚀 快速開始

使用以下代碼片段即可開始與 quantumaikr/llama-2-70b-fb16-korean 進行對話：

import torch
from transformers import AutoModelForCausalLM, AutoTokenizer, pipeline

tokenizer = AutoTokenizer.from_pretrained("quantumaikr/llama-2-70b-fb16-korean")
model = AutoModelForCausalLM.from_pretrained("quantumaikr/llama-2-70b-fb16-korean", torch_dtype=torch.float16, device_map="auto")

system_prompt = "### System:\n귀하는 지시를 매우 잘 따르는 AI인 QuantumLM입니다. 최대한 많이 도와주세요. 안전에 유의하고 불법적인 행동은 하지 마세요.\n\n"

message = "인공지능이란 무엇인가요?"
prompt = f"{system_prompt}### User: {message}\n\n### Assistant:\n"
inputs = tokenizer(prompt, return_tensors="pt").to("cuda")
output = model.generate(**inputs, do_sample=True, temperature=0.9, top_p=0.75, max_new_tokens=4096)

print(tokenizer.decode(output[0], skip_special_tokens=True))

💻 使用示例

基礎用法

import torch
from transformers import AutoModelForCausalLM, AutoTokenizer, pipeline

tokenizer = AutoTokenizer.from_pretrained("quantumaikr/llama-2-70b-fb16-korean")
model = AutoModelForCausalLM.from_pretrained("quantumaikr/llama-2-70b-fb16-korean", torch_dtype=torch.float16, device_map="auto")

system_prompt = "### System:\n귀하는 지시를 매우 잘 따르는 AI인 QuantumLM입니다. 최대한 많이 도와주세요. 안전에 유의하고 불법적인 행동은 하지 마세요.\n\n"

message = "인공지능이란 무엇인가요?"
prompt = f"{system_prompt}### User: {message}\n\n### Assistant:\n"
inputs = tokenizer(prompt, return_tensors="pt").to("cuda")
output = model.generate(**inputs, do_sample=True, temperature=0.9, top_p=0.75, max_new_tokens=4096)

print(tokenizer.decode(output[0], skip_special_tokens=True))

高級用法

# 可以根據不同的需求調整生成參數，如調整溫度、採樣策略等，以獲得不同風格的回覆。
import torch
from transformers import AutoModelForCausalLM, AutoTokenizer, pipeline

tokenizer = AutoTokenizer.from_pretrained("quantumaikr/llama-2-70b-fb16-korean")
model = AutoModelForCausalLM.from_pretrained("quantumaikr/llama-2-70b-fb16-korean", torch_dtype=torch.float16, device_map="auto")

system_prompt = "### System:\n귀하는 지시를 매우 잘 따르는 AI인 QuantumLM입니다. 최대한 많이 도와주세요. 안전에 유의하고 불법적인 행동은 하지 마세요.\n\n"

message = "인공지능이란 무엇인가요?"
prompt = f"{system_prompt}### User: {message}\n\n### Assistant:\n"
inputs = tokenizer(prompt, return_tensors="pt").to("cuda")
# 調整生成參數
output = model.generate(**inputs, do_sample=True, temperature=0.7, top_p=0.8, max_new_tokens=2048)

print(tokenizer.decode(output[0], skip_special_tokens=True))

QuantumLM應使用以下提示格式：

### System:
This is a system prompt, please behave and help the user.

### User:
Your prompt here

### Assistant
The output of QuantumLM

📚 詳細文檔

使用與限制

預期用途

這些模型僅用於研究目的，需遵守 CC BY-NC 4.0 許可協議。

限制和偏差

儘管上述數據集有助於引導基礎語言模型生成“更安全”的文本分佈，但並非所有偏差和毒性都能通過微調來緩解。我們提醒用戶注意生成回覆中可能出現的此類潛在問題。請勿將模型輸出視為人類判斷的替代品或事實來源，請負責任地使用該模型。

⚠️ 重要提示

這些模型僅用於研究，需遵守 CC BY-NC 4.0 許可協議。

💡 使用建議

注意生成回覆中可能存在的偏差和毒性問題，不要將模型輸出作為人類判斷的替代品，需負責任地使用。

聯繫我們：hi@quantumai.kr

屬性	詳情
模型類型	Llama2 70B模型針對韓語數據集微調
預期用途	僅用於研究，遵守 CC BY-NC 4.0 許可協議

精選推薦AI模型

Llama 3 Typhoon V1.5x 8b Instruct

專為泰語設計的80億參數指令模型，性能媲美GPT-3.5-turbo，優化了應用場景、檢索增強生成、受限生成和推理任務

Cadet-Tiny是一個基於SODA數據集訓練的超小型對話模型，專為邊緣設備推理設計，體積僅為Cosmo-3B模型的2%左右。

Roberta Base Chinese Extractive Qa

基於RoBERTa架構的中文抽取式問答模型，適用於從給定文本中提取答案的任務。

智啟未來，您的人工智能解決方案智庫