K

Kimi Dev 72B GGUF

Developed by ubergarm
Kimi-Dev-72B的量化版本,采用先进的非线性最优量化和多头潜在注意力机制,减少存储和计算需求。
Downloads 2,780
Release Time : 6/19/2025

Model Overview

该模型是Kimi-Dev-72B的量化版本,通过特定的量化方法在保证性能的同时降低资源消耗,适用于文本生成任务。

Model Features

先进的量化方法
采用非线性最优量化和多头潜在注意力机制,显著减少模型存储和计算需求。
高性能推理
在高端硬件配置下,每批2k时PP约500个令牌/秒,TG约5个令牌/秒。
平衡的质量与速度
通过一系列实验性量化测试,在质量和速度之间取得了不错的平衡。

Model Capabilities

文本生成
高效推理
量化模型支持

Use Cases

文本生成
高效文本生成
在保证一定性能的前提下,减少模型的存储和计算需求,适用于需要高效文本生成的场景。
每批2k时PP约500个令牌/秒,TG约5个令牌/秒。
AIbase
Empowering the Future, Your AI Solution Knowledge Base
© 2025AIbase