C

Causallm 14B DPO Alpha GGUF

tastypearによって開発
14Bパラメータの因果言語モデルをベースに、DPO最適化トレーニングを経て、中英文テキスト生成タスクをサポート
ダウンロード数 2,238
リリース時間 : 11/25/2023

モデル概要

これは直接嗜好最適化(DPO)でトレーニングされた14Bパラメータの因果言語モデルで、テキスト生成タスク向けに設計されており、中英バイリンガル処理をサポートします。MT-Benchベンチマークテストで優れた性能を発揮し、GPT-3.5レベルに近い結果を示しています。

モデル特徴

DPO最適化トレーニング
直接嗜好最適化手法を採用し、モデル出力を人間の嗜好により適合させる
バイリンガルサポート
英語と中国語のテキスト生成タスクを同時にサポート
高性能
MT-Benchベンチマークテストで7.618868のスコアを獲得、GPT-3.5レベルに近い
GGUFフォーマットサポート
GGUFフォーマットモデルファイルを提供し、様々な推論クライアントやライブラリと互換性がある

モデル能力

テキスト生成
対話システム
質問応答システム
コンテンツ作成

使用事例

インテリジェント対話
チャットボット
中英バイリンガルチャットボットの構築
GPT-3.5レベルの対話体験
コンテンツ作成
記事生成
プロンプトに基づき中英文記事を生成
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase