Dhruv-27B開源語言模型 - 免費部署助力學術、邏輯和事實評估推理

首頁

Dhruv 27B

由vicharai開發

Dhruv-27B-preview是基於Gemma3的270億參數語言模型，專為高級推理任務微調，適用於學術、邏輯和事實評估。

大型語言模型

Transformers

#270億參數推理 #學術問答優化 #多語言事實推理

下載量 18

發布時間 : 3/18/2025

模型概述

Dhruv-27B-preview是一個高性能語言模型，針對推理、問答和事實正確性進行了優化，適用於研究、企業應用和通用知識理解。

模型特點

高級推理能力

針對推理任務進行了專門優化，能夠進行深度上下文推理和思維鏈生成。

高性能基準測試

在MMLU和GPQA等基準測試中表現優異，顯示出強大的知識理解和推理能力。

高效推理

支持int8量化，提高了推理效率。

模型能力

高級推理

問答任務

事實評估

多語言處理

思維鏈生成

使用案例

學術研究

學術問答

用於回答複雜的學術問題，提供準確的解釋和分析。

在MMLU 5-shot測試中達到80.0%的準確率。

企業應用

事實核查

用於企業環境中的事實核查和信息驗證。

AI代理

通用推理代理

作為需要強大知識理解的AI代理的核心組件。

🚀 Dhruv-27b-preview模型卡片

Dhruv-27b-preview是一款強大的語言模型，基於Gemma3架構，擁有270億參數。它針對高級推理任務進行了微調，能在學術、邏輯和事實評估中展現卓越性能，適用於研究、企業應用等多種場景。

🚀 快速開始

若要在Hugging Face上使用Gemma，你需要查看並同意Google的使用許可。請確保你已登錄Hugging Face，然後點擊下方按鈕，請求將立即處理。 [確認許可](Acknowledge license)

✨ 主要特性

強大推理能力：基於Gemma3架構，經過微調，擅長高級推理任務。
高性能表現：在關鍵基準測試中取得優異成績，如MMLU（5-shot）達到80.0%，GPQA（0-shot）達到52.0%。
廣泛應用場景：適用於研究、學術問答、通用推理代理、多語言事實推理以及對事實準確性和深度有高要求的企業AI工具。

📚 詳細文檔

模型概述

Dhruv-27B-preview是基於Gemma3的270億參數語言模型，屬於Gemini推理系列。它經過優化，在學術、邏輯和事實評估中表現出色，能夠進行深度上下文推理和思維鏈生成，適合需要強大常識理解能力的研究、企業應用和AI代理。

關鍵指標

Dhruv-27b-preview在關鍵基準測試中表現強勁：

+------------------------+--------+
|        指標         | 得分  |
+------------------------+--------+
| MMLU (5-shot)          | 80.0%  |
| GPQA (0-shot)          | 52.0%  |
+------------------------+--------+

模型架構

屬性	詳情
基礎模型	Gemma3
模型規模	270億參數
模型類型	僅解碼器的Transformer（因果語言模型）
精度	採用bf16和int8量化以提高推理效率
訓練目標	針對推理、問答和事實正確性進行指令微調

預期用途

研究和學術問答任務
通用推理代理
多語言事實推理
對事實準確性和深度有高要求的企業AI工具

使用方法

使用系統模板

侷限性

未針對創造性生成或對話任務進行優化。
在訓練數據有限的領域可能會產生幻覺。
對於複雜指令，需要精細的提示工程。

引用

@misc{vicharai_dhruv27b,
  title={Dhruv-27B: Gemma3 Reasoning Model},
  author={vicharai},
  year={2025},
  publisher={vicharai},
  url={https://vichar.io}
}

由vichar ai開發 Huggingface 官網