OpenThaiGPT 70b 1.0.0開源泰語聊天模型 - 免費部署優化泰語交流體驗

首頁

Openthaigpt 1.0.0 70b Chat

由openthaigpt開發

OpenThaiGPT 70b 1.0.0是基於LLaMA v2的700億參數泰語聊天模型，專門針對泰語指令進行了微調，顯著提升了泰語處理能力。

大型語言模型支持多種語言#泰語大模型 #700億參數 #多輪對話

下載量 137

發布時間 : 4/5/2024

模型概述

這是一款領先的泰語大語言模型，在多項泰語考試中表現優異，支持多輪對話和檢索增強生成（RAG），適用於複雜的泰語理解和生成任務。

模型特點

領先的泰語處理能力

在多項泰語考試中平均得分最高，超越了所有其他開源的泰語LLM。

首個700億參數的泰語開源LLM

在泰語考試中的得分高於OpenAI GPT 3.5、Google Gemini和Claude 3 Haiku。

多輪對話支持

能夠處理複雜的多輪對話場景。

檢索增強生成（RAG）支持

可以結合外部信息生成更豐富的回答。

優化的生成速度

通過添加10,000個常用泰語詞彙，生成速度提升十倍。

模型能力

泰語文本生成

多輪對話

檢索增強生成

泰語理解

指令跟隨

使用案例

教育

泰語考試輔導

幫助學生準備泰語相關考試

在多項泰語考試中表現優異

客服

泰語客服機器人

處理泰語客戶的諮詢和問題

能夠理解複雜泰語指令並提供準確回答

內容創作

泰語內容生成

生成高質量的泰語文章、報告等

生成自然流暢的泰語文本

🚀 🇹🇭 OpenThaiGPT 70b 1.0.0

OpenThaiGPT 70b 1.0.0是一款先進的泰語聊天模型，擁有700億參數。它基於LLaMA v2開發，於2024年4月8日發佈。該模型針對泰語指令進行了專門微調，並將超過10,000個最常用的泰語單詞添加到大型語言模型（LLM）的字典中，顯著提高了響應速度。

🚀 快速開始

你可以按照以下不同方式使用OpenThaiGPT：

Huggingface

from transformers import AutoModelForCausalLM, AutoTokenizer
import torch

# Ensure CUDA is available
device = 'cuda' if torch.cuda.is_available() else 'cpu'
print(f"Using device: {device}")

# Init Model
model_path="openthaigpt/openthaigpt-1.0.0-7b-chat"
tokenizer = AutoTokenizer.from_pretrained(model_path, trust_remote_code=True)
model = AutoModelForCausalLM.from_pretrained(model_path, trust_remote_code=True, torch_dtype=torch.float16)
model.to(device)

# Prompt
prompt = "สวัสดีครับ OpenThaiGPT"
llama_prompt = f"<s>[INST] <<SYS>>\nYou are a question answering assistant. Answer the question as truthful and helpful as possible คุณคือผู้ช่วยตอบคำถาม จงตอบคำถามอย่างถูกต้องและมีประโยชน์ที่สุด<</SYS>>\n\n{prompt} [/INST]"
inputs = tokenizer.encode(llama_prompt, return_tensors="pt")
inputs = inputs.to(device)

# Generate
outputs = model.generate(inputs, max_length=512, num_return_sequences=1)
print(tokenizer.decode(outputs[0], skip_special_tokens=True))

vLLM

安裝VLLM (https://github.com/vllm-project/vllm)
運行服務器

python -m vllm.entrypoints.api_server --model /path/to/model --tensor-parallel-size num_gpus

運行推理（CURL示例）

curl --request POST \
    --url http://localhost:8000/generate \
    --header "Content-Type: application/json" \
    --data '{"prompt": "<s>[INST] <<SYS>>\nYou are a question answering assistant. Answer the question as truthful and helpful as possible คุณคือผู้ช่วยตอบคำถาม จงตอบคำถามอย่างถูกต้องและมีประโยชน์ที่สุด\n<</SYS>>\n\nอยากลดความอ้วนต้องทำอย่างไร [/INST]","use_beam_search": false, "temperature": 0.1, "max_tokens": 512, "top_p": 0.75, "top_k": 40, "frequency_penalty": 0.3 "stop": "</s>"}'

LlamaCPP (for GGUF)

構建並安裝LlamaCPP（LLAMA_CUBLAS=1用於GPU推理）

git clone https://github.com/ggerganov/llama.cpp.git \
  && cd llama.cpp \
  && make -j LLAMA_CUBLAS=1 CUDA_DOCKER_ARCH=all

運行服務器

./server -m /path/to/ggml-model-f16.gguf -c 3072 -ngl 81 -ts 1,1 --host 0.0.0.0

運行推理（CURL示例）

curl --location 'http://localhost:8000/completion' \
--header 'Content-Type: application/json' \
--data '{
    "prompt":"<s>[INST] <<SYS>>\nYou are a question answering assistant. Answer the question as truthful and helpful as possible คุณคือผู้ช่วยตอบคำถาม จงตอบคำถามอย่างถูกต้องและมีประโยชน์ที่สุด friendly\n\n<<SYS>>\n\nอยากลดความอ้วนต้องทำอย่างไร [/INST]",
    "max_tokens": 512,
    "stop":"</s>"
}'

✨ 主要特性

前沿的泰語大語言模型：在多項泰語考試中，與其他所有開源泰語大語言模型相比，取得了最高的平均分數，樹立了新的標杆。
首個700億參數的泰語開源大語言模型：在泰語考試中的得分高於OpenAI GPT 3.5、Google Gemini和Claude 3 Haiku。
支持多輪擴展對話：能夠進行多輪的連續對話。
支持檢索增強生成（RAG）用例：用於生成更豐富的回覆。
生成速度提高十倍：由於在模型字典中添加了10,000個常用泰語單詞。
基於超過650億個泰語單詞進行預訓練：並使用超過100萬個泰語指令示例進行了精心微調。
能夠理解和處理長達4096個泰語單詞的輸入上下文：允許詳細和複雜的指令。

📚 詳細文檔

在OpenThaiGPT評估中的基準測試

請查看OTG 13b (2024年4月)以獲取該模型的評估結果。

考試	OTG 7b (2023年8月)	OTG 13b (2023年12月)	OTG 7b (2024年4月)	OTG 13b (2024年4月)	OTG 70b (2024年4月)	SeaLLM 7b v1	SeaLLM 7b v2	SeaLion 7b	WanchanGLM 7b	Sailor-7b-Chat	TyphoonGPT 7b Instruct	GPT3.5	GPT4	Gemini Pro	Gemini 1.5	Claude 3 Haiku	Claude 3 Sonnet	Claude 3 Opus
A-Level	17.50%	34.17%	25.00%	30.83%	45.83%	18.33%	34.17%	21.67%	17.50%	40.00%	37.50%	38.33%	65.83%	56.67%	55.83%	58.33%	59.17%	77.50%
TGAT	24.00%	22.00%	22.00%	36.00%	36.00%	14.00%	28.00%	24.00%	16.00%	34.00%	30.00%	28.00%	44.00%	22.00%	28.00%	36.00%	34.00%	46.00%
TPAT1	22.50%	47.50%	42.50%	27.50%	62.50%	22.50%	27.50%	22.50%	17.50%	40.00%	47.50%	45.00%	52.50%	52.50%	50.00%	52.50%	50.00%	62.50%
thai_investment_consultant_exams	8.00%	28.00%	76.00%	84.00%	68.00%	16.00%	28.00%	24.00%	16.00%	24.00%	32.00%	40.00%	64.00%	52.00%	32.00%	44.00%	64.00%	72.00%
facebook_beleble_tha_200	25.00%	45.00%	34.50%	39.50%	70.00%	13.50%	51.00%	27.00%	24.50%	63.00%	51.50%	50.00%	72.50%	65.00%	74.00%	63.50%	77.00%	90.00%
xcopa_th_200	45.00%	56.50%	49.50%	51.50%	74.50%	26.50%	47.00%	51.50%	48.50%	68.50%	65.00%	64.00%	82.00%	68.00%	74.00%	64.00%	80.00%	86.00%
xnli2.0_th_200	33.50%	34.50%	39.50%	31.00%	47.00%	21.00%	43.00%	37.50%	33.50%	16.00%	20.00%	50.00%	69.00%	53.00%	54.50%	50.00%	68.00%	68.50%
ONET M3	17.85%	38.86%	34.11%	39.36%	56.15%	15.58%	23.92%	21.79%	19.56%	21.37%	28.03%	37.91%	49.97%	55.99%	57.41%	52.73%	40.60%	63.87%
ONET M6	21.14%	28.87%	22.53%	23.32%	42.85%	15.09%	19.48%	16.96%	20.67%	28.64%	27.46%	34.44%	46.29%	45.53%	50.23%	34.79%	38.49%	48.56%
平均分數	23.83%	37.27%	38.40%	40.33%	55.87%	18.06%	33.56%	27.44%	23.75%	37.28%	37.67%	43.07%	60.68%	52.30%	52.89%	50.65%	56.81%	68.32%

泰語多項選擇題考試，在未見測試集上進行測試，零樣本學習。基準測試源代碼和考試信息：https://github.com/OpenThaiGPT/openthaigpt_eval

(更新於：2024年4月7日)

由外部方（Float16.cloud）評估的M3Exam基準測試

模型	英語 (M3EXAM)	泰語 (M3EXAM)
OTG - 7b	40.92 %	25.14 %
OTG - 13b	53.69 %	36.49 %
OTG - 70b	72.58 %	48.29 %
GPT - 3.5 - turbo - 0613*	-	34.1 %
GPT - 4 - 0613*	-	56.0 %

更多信息：https://blog.float16.cloud/the-first-70b-thai-llm/

提示格式

提示格式基於Llama2進行了小修改（添加 "###" 以指定上下文部分）

<s>[INST] <<SYS>
{system_prompt}
<</SYS>>

{human_turn1}###{context_turn1} [/INST]{assistant_turn1}</s><s>{human_turn2}###{context_turn2} [/INST] ...

系統提示

You are a question answering assistant. Answer the question as truthful and helpful as possible คุณคือผู้ช่วยตอบคำถาม จงตอบคำถามอย่างถูกต้องและมีประโยชน์ที่สุด

示例

單輪對話示例

<s>[INST] <<SYS>
You are a question answering assistant. Answer the question as truthful and helpful as possible คุณคือผู้ช่วยตอบคำถาม จงตอบคำถามอย่างถูกต้องและมีประโยชน์ที่สุด
<</SYS>>

สวัสดีครับ [/INST]

帶上下文的單輪對話（RAG）示例

<s>[INST] <<SYS>
You are a question answering assistant. Answer the question as truthful and helpful as possible คุณคือผู้ช่วยตอบคำถาม จงตอบคำถามอย่างถูกต้องและมีประโยชน์ที่สุด
<</SYS>>

กรุงเทพมีพื้นที่เท่าไร่###กรุงเทพมหานคร เป็นเมืองหลวง นครและมหานครที่มีประชากรมากที่สุดของประเทศไทย กรุงเทพมหานครมีพื้นที่ทั้งหมด 1,568.737 ตร.กม. มีประชากรตามทะเบียนราษฎรกว่า 8 ล้านคน [/INST]

多輪對話示例

第一輪

<s>[INST] <<SYS>
You are a question answering assistant. Answer the question as truthful and helpful as possible คุณคือผู้ช่วยตอบคำถาม จงตอบคำถามอย่างถูกต้องและมีประโยชน์ที่สุด
<</SYS>>

สวัสดีครับ [/INST]

第二輪

<s>[INST] <<SYS>
You are a question answering assistant. Answer the question as truthful and helpful as possible คุณคือผู้ช่วยตอบคำถาม จงตอบคำถามอย่างถูกต้องและมีประโยชน์ที่สุด
<</SYS>>

สวัสดีครับ [/INST]สวัสดีค่ะ มีคำถามอะไร ถามได้เลย</s><s>ขอสูตรทำส้มตำหน่อย [/INST]

第三輪

<s>[INST] <<SYS>
You are a question answering assistant. Answer the question as truthful and helpful as possible คุณคือผู้ช่วยตอบคำถาม จงตอบคำถามอย่างถูกต้องและมีประโยชน์ที่สุด
<</SYS>>

สวัสดีครับ [/INST]สวัสดีค่ะ มีคำถามอะไร ถามได้เลย</s><s>ขอสูตรทำส้มตำหน่อย [/INST]ได้เลยค่ะ ส้มตำเป็นเมนูที่ทำง่ายและอร่อย มาเริ่มกันเลยนะคะ</s><s>เริ่มได้เลย [/INST]

第四輪

<s>[INST] <<SYS>
You are a question answering assistant. Answer the question as truthful and helpful as possible คุณคือผู้ช่วยตอบคำถาม จงตอบคำถามอย่างถูกต้องและมีประโยชน์ที่สุด
<</SYS>>

สวัสดีครับ [/INST]สวัสดีค่ะ มีคำถามอะไร ถามได้เลย</s><s>ขอสูตรทำส้มตำหน่อย [/INST]ได้เลยค่ะ ส้มตำเป็นเมนูที่ทำง่ายและอร่อย มาเริ่มกันเลยนะคะ</s><s>เริ่มได้เลย [/INST]
ตำไทยเป็นเมนูที่ใครๆ ก็คุ้นเคย ด้วยรสชาติที่กลมกล่อม หวาน เปรี้ยว เค็ม เผ็ด ครบรส วันนี้เราจะมาทำส้มตำด้วยกันค่ะ สิ่งแรกที่ต้องมีคือเครื่องปรุงดังนี้
- มะละกอดิบ 1 ลูก
- กุ้งแห้ง 1/2 ถ้วย
- กระเทียม 3 กลีบ
- พริกขี้หนู 3 เม็ด
- น้ำตาลปี๊บ 1 ช้อนโต๊ะ
- น้ำปลา 2 ช้อนโต๊ะ
- มะนาว 1 ลูก
- งาขาวคั่ว 1/4 ถ้วย

วิธีทำมีดังนี้ค่ะ
1. เริ่มจากล้างมะละกอให้สะอาด แล้วใช้มีดปอกเปลือก เอาไส้ออก หั่นเป็นเส้นบางๆ เตรียมไว้
2. ตำกุ้งแห้งให้ละเอียด แล้วตักขึ้นพักไว้
3. ใช้ครกหินหรือเครื่องปั่น บดพริกขี้หนูกับกระเทียมให้ละเอียด
4. ใส่กุ้งแห้งที่ตำแล้วลงไปผสม ตามด้วยน้ำตาลปี๊บ น้ำปลา มะนาว และเส้นมะละกอ คลุกเคล้าให้เข้ากัน
5. ชิมรสให้ได้รสหวาน เปรี้ยว เค็ม เผ็ด จากนั้นตักขึ้นเสิร์ฟพร้อมผักสด อาทิ กะหล่ำปลี ถั่วงอก แครอท ผักบุ้ง</s><s>ขอบคุณครับ [/INST]

帶上下文的多輪對話（RAG）示例

<s>[INST] <<SYS>
You are a question answering assistant. Answer the question as truthful and helpful as possible คุณคือผู้ช่วยตอบคำถาม จงตอบคำถามอย่างถูกต้องและมีประโยชน์ที่สุด
<</SYS>>

กรุงเทพมีพื้นที่เท่าไร่###กรุงเทพมหานคร เป็นเมืองหลวง นครและมหานครที่มีประชากรมากที่สุดของประเทศไทย กรุงเทพมหานครมีพื้นที่ทั้งหมด 1,568.737 ตร.กม. มีประชากรตามทะเบียนราษฎรกว่า 8 ล้านคน [/INST]
กรุงเทพมหานครมีพื้นที่ทั้งหมด 1,568.737 ตร.กม.</s><s>และประชากรล่ะ [/INST]

GPU內存要求

參數數量	FP 16位	8位（量化）	4位（量化）	4位示例顯卡
7b	24 GB	12 GB	6 GB	Nvidia RTX 4060 8GB
13b	48 GB	24 GB	12 GB	Nvidia RTX 4070 16GB
70b	192 GB	96 GB	48 GB	Nvidia RTX 4090 24GB x 2張

🔧 技術細節

OpenThaiGPT 70b 1.0.0基於LLaMA v2開發，預訓練時使用了超過650億個泰語單詞，並使用超過100萬個泰語指令示例進行了微調。通過在模型字典中添加10,000個常用泰語單詞，顯著提高了生成速度。

📄 許可證

源代碼：採用Apache軟件許可證2.0。權重：可用於研究和商業用途。

支持與贊助

贊助方

支持渠道

官方網站：https://openthaigpt.aieat.or.th
Facebook頁面：https://web.facebook.com/groups/openthaigpt
Discord服務器：點擊加入
郵箱：kobkrit@aieat.or.th

團隊成員

Kobkrit Viriyayudhakorn (kobkrit@aieat.or.th)
Sumeth Yuenyong (sumeth.yue@mahidol.edu)
Thaweewat Rugsujarit (thaweewr@scg.com)
Jillaphat Jaroenkantasima (autsadang41@gmail.com)
Norapat Buppodom (new@norapat.com)
Koravich Sangkaew (kwankoravich@gmail.com)
Peerawat Rojratchadakorn (peerawat.roj@gmail.com)
Surapon Nonesung (nonesungsurapon@gmail.com)
Chanon Utupon (chanon.utupon@gmail.com)
Sadhis Wongprayoon (sadhis.tae@gmail.com)
Nucharee Thongthungwong (nuchhub@hotmail.com)
Chawakorn Phiantham (mondcha1507@gmail.com)
Patteera Triamamornwooth (patt.patteera@gmail.com)
Nattarika Juntarapaoraya (natt.juntara@gmail.com)
Kriangkrai Saetan (kraitan.ss21@gmail.com)
Pitikorn Khlaisamniang (pitikorn32@gmail.com)

引用

如果OpenThaiGPT對你的工作有幫助，請考慮以下引用方式：

Bibtex

@misc{yuenyong2024openthaigpt15thaicentricopen,
      title={OpenThaiGPT 1.5: A Thai-Centric Open Source Large Language Model}, 
      author={Sumeth Yuenyong and Kobkrit Viriyayudhakorn and Apivadee Piyatumrong and Jillaphat Jaroenkantasima},
      year={2024},
      eprint={2411.07238},
      archivePrefix={arXiv},
      primaryClass={cs.CL},
      url={https://arxiv.org/abs/2411.07238}, 
}

APA格式（適用於TXT、MS Word）

Yuenyong, S., Viriyayudhakorn, K., Piyatumrong, A., & Jaroenkantasima, J. (2024). OpenThaiGPT 1.5: A Thai-Centric Open Source Large Language Model. arXiv [Cs.CL]. Retrieved from http://arxiv.org/abs/2411.07238

免責聲明：提供的回覆不保證完全準確。