🚀 模型ID的模型卡片
本模型是一個🤗 Transformers模型,能夠基於簡短但高質量的SFT數據集進行思考,在處理問題時表現出色。
🚀 快速開始
使用以下代碼開始使用該模型:
✨ 主要特性
- 該模型在2.1k個示例的混合數據集上進行訓練,其中大部分數據是手動收集和驗證的。
- 由於使用了簡短但高質量的SFT數據集,該模型的思考過程比QWQ和R1模型要短得多。
- 可以使用特定的系統消息觸發思考標籤,例如:
- "You are an expert assistant. Think using tags."
- "You are a thinking assistant."
📚 詳細文檔
模型詳情
模型描述
- 模型在2.1k個示例的混合數據集上訓練,大部分數據手動收集並驗證。
- 由於簡短而高質量的SFT數據集,該模型的思考過程將比QWQ和R1模型短得多。
- 觸發思考標籤的系統消息(應置於"<start_of_turn>user"下):
- "You are an expert assistant. Think using tags."
- "You are a thinking assistant."
示例:
<start_of_turn>user
You are a thinking assistant.
(1,234)² means 1,234 * 1,234; (1,234)³ means 1,234 * 1,234 * 1,234; and so forth. When (1,234)²³ is completely multiplied out, what will the number be in the ones place?
...

本模型卡片為自動生成,相關信息如下:
屬性 |
詳情 |
開發者 |
[待補充更多信息] |
資助方(可選) |
[待補充更多信息] |
共享方(可選) |
[待補充更多信息] |
模型類型 |
[待補充更多信息] |
語言(NLP) |
[待補充更多信息] |
許可證 |
[待補充更多信息] |
微調基礎模型(可選) |
[待補充更多信息] |
模型來源(可選)
- 倉庫地址:[待補充更多信息]
- 論文(可選):[待補充更多信息]
- 演示(可選):[待補充更多信息]
用途
直接使用
[待補充更多信息]
下游使用(可選)
[待補充更多信息]
超出適用範圍的使用
[待補充更多信息]
偏差、風險和侷限性
[待補充更多信息]
建議
用戶(包括直接用戶和下游用戶)應瞭解該模型的風險、偏差和侷限性。如需進一步建議,還需補充更多信息。
訓練詳情
訓練數據
[待補充更多信息]
訓練過程
預處理(可選)
[待補充更多信息]
訓練超參數
速度、大小、時間(可選)
[待補充更多信息]
評估
測試數據、因素和指標
測試數據
[待補充更多信息]
因素
[待補充更多信息]
指標
[待補充更多信息]
結果
[待補充更多信息]
總結
模型審查(可選)
[待補充更多信息]
環境影響
可以使用Lacoste等人(2019)中提出的機器學習影響計算器來估算碳排放。
屬性 |
詳情 |
硬件類型 |
[待補充更多信息] |
使用時長 |
[待補充更多信息] |
雲服務提供商 |
[待補充更多信息] |
計算區域 |
[待補充更多信息] |
碳排放 |
[待補充更多信息] |
技術規格(可選)
模型架構和目標
[待補充更多信息]
計算基礎設施
硬件
[待補充更多信息]
軟件
[待補充更多信息]
引用(可選)
BibTeX
[待補充更多信息]
APA
[待補充更多信息]
術語表(可選)
[待補充更多信息]
更多信息(可選)
[待補充更多信息]
模型卡片作者(可選)
[待補充更多信息]
模型卡片聯繫方式
[待補充更多信息]