M

Magnum V4 72b FP8 Dynamic

由 Infermatic 开发
基于Qwen2.5-72B-Instruct微调的72B参数大语言模型,采用动态FP8量化技术优化推理效率,旨在复现Claude 3的散文质量
下载量 2,106
发布时间 : 10/21/2024

模型简介

这是一个实验性模型,在Qwen2.5-72B-Instruct基础上进行指令微调,专注于高质量文本生成,特别是模仿Claude 3的写作风格

模型特点

动态FP8量化
采用AutoFP8技术进行动态量化,显著提升推理效率同时保持模型质量
长上下文支持
支持32k tokens的上下文长度,适合长文档处理
Claude风格写作
专门优化以复现Claude 3(特别是Sonnet和Opus)的散文质量
多数据集微调
使用6个高质量数据集进行全参数微调,提升多样化任务表现

模型能力

长文本生成
对话系统
创意写作
指令跟随
角色扮演

使用案例

创意写作
文学创作辅助
生成具有Claude风格的高质量散文和故事
可产生风格接近Claude 3的文学作品
对话系统
角色扮演聊天
在SillyTavern等平台实现高质量角色互动
支持复杂角色设定和情景对话
AIbase
智启未来,您的人工智能解决方案智库
© 2025AIbase