O

Olmo 7B Instruct

由allenai開發
OLMo 7B Instruct是基於Dolma數據集訓練的開放語言模型,經過SFT和DPO優化,專為問答任務設計。
下載量 365
發布時間 : 2/23/2024

模型概述

OLMo系列是開放語言模型,旨在推動語言模型科學研究。7B Instruct版本通過微調技術優化了問答性能。

模型特點

開放研究
公開所有訓練代碼、檢查點和模型細節,推動科學研究
優化問答性能
通過SFT和DPO微調技術顯著提升問答任務表現
低毒性輸出
相比基礎模型,毒性輸出比例從81.4%降至1.7%

模型能力

英文文本生成
問答系統
指令跟隨

使用案例

教育研究
語言模型研究
用於研究語言模型的行為和性能
提供完全透明的訓練過程和模型細節
智能助手
問答系統
構建知識問答應用
在TruthfulQA上準確率達到52%
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase