🚀 模型ID的模型卡片
本模型是一个🤗 Transformers模型,能够基于简短但高质量的SFT数据集进行思考,在处理问题时表现出色。
🚀 快速开始
使用以下代码开始使用该模型:
✨ 主要特性
- 该模型在2.1k个示例的混合数据集上进行训练,其中大部分数据是手动收集和验证的。
- 由于使用了简短但高质量的SFT数据集,该模型的思考过程比QWQ和R1模型要短得多。
- 可以使用特定的系统消息触发思考标签,例如:
- "You are an expert assistant. Think using tags."
- "You are a thinking assistant."
📚 详细文档
模型详情
模型描述
- 模型在2.1k个示例的混合数据集上训练,大部分数据手动收集并验证。
- 由于简短而高质量的SFT数据集,该模型的思考过程将比QWQ和R1模型短得多。
- 触发思考标签的系统消息(应置于"<start_of_turn>user"下):
- "You are an expert assistant. Think using tags."
- "You are a thinking assistant."
示例:
<start_of_turn>user
You are a thinking assistant.
(1,234)² means 1,234 * 1,234; (1,234)³ means 1,234 * 1,234 * 1,234; and so forth. When (1,234)²³ is completely multiplied out, what will the number be in the ones place?
...

本模型卡片为自动生成,相关信息如下:
属性 |
详情 |
开发者 |
[待补充更多信息] |
资助方(可选) |
[待补充更多信息] |
共享方(可选) |
[待补充更多信息] |
模型类型 |
[待补充更多信息] |
语言(NLP) |
[待补充更多信息] |
许可证 |
[待补充更多信息] |
微调基础模型(可选) |
[待补充更多信息] |
模型来源(可选)
- 仓库地址:[待补充更多信息]
- 论文(可选):[待补充更多信息]
- 演示(可选):[待补充更多信息]
用途
直接使用
[待补充更多信息]
下游使用(可选)
[待补充更多信息]
超出适用范围的使用
[待补充更多信息]
偏差、风险和局限性
[待补充更多信息]
建议
用户(包括直接用户和下游用户)应了解该模型的风险、偏差和局限性。如需进一步建议,还需补充更多信息。
训练详情
训练数据
[待补充更多信息]
训练过程
预处理(可选)
[待补充更多信息]
训练超参数
速度、大小、时间(可选)
[待补充更多信息]
评估
测试数据、因素和指标
测试数据
[待补充更多信息]
因素
[待补充更多信息]
指标
[待补充更多信息]
结果
[待补充更多信息]
总结
模型审查(可选)
[待补充更多信息]
环境影响
可以使用Lacoste等人(2019)中提出的机器学习影响计算器来估算碳排放。
属性 |
详情 |
硬件类型 |
[待补充更多信息] |
使用时长 |
[待补充更多信息] |
云服务提供商 |
[待补充更多信息] |
计算区域 |
[待补充更多信息] |
碳排放 |
[待补充更多信息] |
技术规格(可选)
模型架构和目标
[待补充更多信息]
计算基础设施
硬件
[待补充更多信息]
软件
[待补充更多信息]
引用(可选)
BibTeX
[待补充更多信息]
APA
[待补充更多信息]
术语表(可选)
[待补充更多信息]
更多信息(可选)
[待补充更多信息]
模型卡片作者(可选)
[待补充更多信息]
模型卡片联系方式
[待补充更多信息]