K

Kimi Dev 72B GGUF

由ubergarm開發
Kimi-Dev-72B的量化版本,採用先進的非線性最優量化和多頭潛在注意力機制,減少存儲和計算需求。
下載量 2,780
發布時間 : 6/19/2025

模型概述

該模型是Kimi-Dev-72B的量化版本,通過特定的量化方法在保證性能的同時降低資源消耗,適用於文本生成任務。

模型特點

先進的量化方法
採用非線性最優量化和多頭潛在注意力機制,顯著減少模型存儲和計算需求。
高性能推理
在高端硬件配置下,每批2k時PP約500個令牌/秒,TG約5個令牌/秒。
平衡的質量與速度
通過一系列實驗性量化測試,在質量和速度之間取得了不錯的平衡。

模型能力

文本生成
高效推理
量化模型支持

使用案例

文本生成
高效文本生成
在保證一定性能的前提下,減少模型的存儲和計算需求,適用於需要高效文本生成的場景。
每批2k時PP約500個令牌/秒,TG約5個令牌/秒。
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase