openbuddy-qwq-32b-v25.2q-200k開源多語言聊天機器人

首頁

Openbuddy Qwq 32b V25.2q 200k

由OpenBuddy開發

專為增強量化推理能力優化的多語言聊天機器人，支持8種語言，基於Qwen/QwQ-32B模型開發

大型語言模型

Safetensors

支持多種語言開源協議:Apache-2.0 #多語言聊天助手 #20萬詞元長上下文 #量化推理優化

下載量 41

發布時間 : 4/19/2025

模型概述

OpenBuddy是一個開放的多語言聊天機器人助手，經過特殊優化以提升量化推理性能，推薦在3至8位量化場景中使用。

模型特點

增強量化推理能力

專門優化以提升3至8位量化場景下的推理性能

多語言支持

支持8種主要語言的文本生成和理解

長上下文處理

支持長達20萬詞元的上下文處理能力

安全內容控制

內置安全機制防止生成有害、歧視性或不適當內容

模型能力

多語言對話

長文本理解

知識問答

量化推理優化

使用案例

智能助手

多語言客服機器人

為企業提供多語言客戶支持服務

可處理多種語言的客戶諮詢

教育輔助

幫助學生進行多語言學習和知識查詢

提供截至2023年4月的知識支持

量化推理應用

邊緣設備部署

在資源受限設備上部署量化模型

3-8位量化場景下的高效推理

🚀 ⚛️ Q 模型：優化增強量化推理能力

該模型經過特別優化，旨在提升量化推理性能，推薦在 3 至 8 位量化場景中使用。

🚀 快速開始

項目相關鏈接

GitHub 與使用指南：https://github.com/OpenBuddy/OpenBuddy
網站與演示：https://openbuddy.ai
本模型評估結果：Evaluation.txt

✨ 主要特性

此模型專門針對量化推理性能進行了優化，能在 3 至 8 位量化場景中表現出色。

📚 詳細文檔

模型信息

屬性	詳情
基礎模型	Qwen/QwQ - 32B
上下文長度	200K Tokens
許可證	Apache 2.0

提示詞格式

建議使用 transformers 庫中的快速分詞器，該分詞器在 transformers 和 vllm 庫中默認啟用。其他實現（包括 sentencepiece）可能無法按預期工作，尤其是對於 <|role|>、<|says|> 和 <|end|> 等特殊標記。

<|role|>system<|says|>You(assistant) are a helpful, respectful and honest INTP - T AI Assistant named Buddy. You are talking to a human(user).
Always answer as helpfully and logically as possible, while being safe. Your answers should not include any harmful, political, religious, unethical, racist, sexist, toxic, dangerous, or illegal content. Please ensure that your responses are socially unbiased and positive in nature.
You cannot access the internet, but you have vast knowledge, cutoff: 2023 - 04.
You are trained by OpenBuddy team, (https://openbuddy.ai, https://github.com/OpenBuddy/OpenBuddy), not related to GPT or OpenAI.<|end|>
<|role|>user<|says|>History input 1<|end|>
<|role|>assistant<|says|>History output 1<|end|>
<|role|>user<|says|>History input 2<|end|>
<|role|>assistant<|says|>History output 2<|end|>
<|role|>user<|says|>Current input<|end|>
<|role|>assistant<|says|>

這種格式也在 tokenizer_config.json 中定義，這意味著您可以直接使用 vllm 部署類似 OpenAI 的 API 服務。更多信息，請參考 vllm 文檔。