🚀 粵語大語言模型聊天版 v1.0 - 32B
粵語大語言模型聊天版 v1.0 是 hon9kon9ize 推出的第一代粵語大語言模型。它基於 v0.5 預覽版 的成功經驗,在與香港相關的特定知識和粵語對話方面表現出色。

📚 詳細文檔
模型描述
基礎模型是通過對 通義千問 2.5 32B 進行持續預訓練得到的,使用了 6 億篇公開的香港新聞文章和粵語網站數據。指令微調模型則是使用包含 75000 對指令的數據集進行訓練的,其中 45000 對是由其他大語言模型生成並經過人工審核的粵語指令。
該模型在 玄海超級計算機 上使用 16 塊英偉達 H100 96GB HBM2e GPU 進行訓練。
屬性 |
詳情 |
模型類型 |
粵語大語言模型聊天版 v1.0 - 32B |
基礎模型 |
hon9kon9ize/CantoneseLLM - v1.0 - 32B - cpt |
預訓練數據 |
6 億篇公開的香港新聞文章和粵語網站數據 |
微調數據 |
75000 對指令,其中 45000 對為粵語指令 |
訓練硬件 |
16 塊英偉達 H100 96GB HBM2e GPU |
性能表現
在 香港評估基準 中,該模型在理解粵語和香港文化方面是同類開源大語言模型中的佼佼者。不過,正如我們所看到的,推理模型的表現明顯優於其他模型。目前,團隊正在為 v2 版本開發推理模型。
模型 |
香港文化(零樣本) |
粵語語言學 |
粵語大語言模型聊天版 v0.5 6B |
52.0% |
12.8% |
粵語大語言模型聊天版 v0.5 34B |
72.5% |
54.5% |
粵語大語言模型聊天版 v1.0 3B |
56.0% |
45.7% |
粵語大語言模型聊天版 v1.0 7B |
60.3% |
46.5% |
粵語大語言模型聊天版 v1.0 32B |
69.8% |
52.7% |
粵語大語言模型聊天版 v1.0 72B |
75.4% |
59.6% |
Llama 3.1 8B 指令版 |
45.6% |
35.1% |
Llama 3.1 70B 指令版 |
63.0% |
50.3% |
通義千問 2.5 7B 指令版 |
51.2% |
30.3% |
通義千問 2.5 32B 指令版 |
59.9% |
45.1% |
通義千問 2.5 72B 指令版 |
65.9% |
45.9% |
Claude 3.5 Sonnet |
71.7% |
63.2% |
DeepSeek R1 |
88.8% |
77.5% |
Gemini 2.0 Flash |
80.2% |
75.3% |
Gemini 2.5 Pro |
92.1% |
87.3% |
GPT4o |
77.5% |
63.8% |
GPT4o - mini |
55.6% |
57.3% |
💻 使用示例
基礎用法
import torch
from transformers import AutoTokenizer, AutoModelForCausalLM
model_id = "hon9kon9ize/CantoneseLLMChat-v1.0-32B"
tokenizer = AutoTokenizer.from_pretrained(model_id)
model = AutoModelForCausalLM.from_pretrained(
model_id,
torch_dtype=torch.bfloat16,
device_map="auto",
)
def chat(messages, temperature=0.9, max_new_tokens=200):
input_ids = tokenizer.apply_chat_template(conversation=messages, tokenize=True, add_generation_prompt=True, return_tensors='pt').to('cuda:0')
output_ids = model.generate(input_ids, max_new_tokens=max_new_tokens, temperature=temperature)
response = tokenizer.decode(output_ids[0][input_ids.shape[1]:], skip_special_tokens=False)
return response
prompt = "邊個係香港特首?"
messages = [
{"role": "system", "content": "you are a helpful assistant."},
{"role": "user", "content": prompt}
]
print(chat(messages))
📄 許可證
許可證類型:其他