S

Stablelm Zephyr 3b GGUF

brittlewis12によって開発
StableLM Zephyr 3Bは30億パラメータの命令チューニングモデルで、公開データセット、合成データセット、直接選好最適化(DPO)でトレーニングされ、優れた性能を発揮します。
ダウンロード数 51
リリース時間 : 4/25/2025

モデル概要

これは30億パラメータの因果言語モデルで、命令タスクに特化して最適化されており、テキスト生成や対話タスクに適しています。

モデル特徴

命令チューニング最適化
モデルは特別な命令チューニング訓練を受けており、ユーザーの命令をより良く理解し実行できます
直接選好最適化(DPO)
直接選好最適化手法を用いて訓練されており、モデル出力の品質と関連性が向上しています
複数データセット訓練
ultrachat_200k、ultrafeedback_binarizedなど複数の高品質データセットに基づいて訓練されています
GGUFフォーマット対応
GGUFフォーマットのモデルファイルを提供しており、様々なデバイスでの実行が容易です

モデル能力

テキスト生成
対話システム
命令理解と実行
コンテンツ作成

使用事例

対話システム
インテリジェントアシスタント
インテリジェントな対話アシスタントとして使用可能
AlpacaEval評価で76%の勝率を獲得
コンテンツ作成
テキスト生成
様々なタイプのテキストコンテンツ生成に使用可能
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase