Q

Qwen2 72B Instruct 2.0bpw H Novel Exl2

由Orion-zhen開發
通義千問新一代72B參數大語言模型,支持131K長文本處理,在語言理解、文本生成、編程和數學推理等領域表現優異
下載量 21
發布時間 : 6/12/2024

模型概述

Qwen2系列72B參數的指令微調版本,採用Transformer架構,支持超長文本處理和多語言交互

模型特點

超長上下文支持
通過YARN技術擴展至131,072 tokens上下文窗口,可處理長文檔和複雜對話
多領域卓越表現
在MMLU、GPQA等學術基準及編程、數學推理任務中超越同類開源模型
量化適配
提供2比特量化版本,可在24G顯存消費級顯卡運行,優化小說生成領域性能

模型能力

長文本理解與生成
多輪對話
代碼生成與解釋
數學問題求解
多語言翻譯
知識問答

使用案例

內容創作
小說生成
利用量化版本生成連貫的長篇敘事內容
經pixiv小說數據集優化,降低領域困惑度
智能助手
知識問答系統
部署為企業級知識庫交互前端
在C-Eval中文評測達83.8分
教育
編程教學
即時代碼解釋與錯誤修正
HumanEval基準達86.0分
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase