S

Starling LM 11B Alpha

CallComplyによって開発
Starling-7Bは、AIフィードバック強化学習(RLAIF)でトレーニングされたオープンソースの大規模言語モデルで、Openchat 3.5をベースにファインチューニングされており、MT Benchで優れたパフォーマンスを発揮します。
ダウンロード数 103
リリース時間 : 12/3/2023

モデル概要

Starling-7Bは、RLHF/RLAIFでファインチューニングされた言語モデルで、主にテキスト生成タスクに使用され、高い対話と推論能力を持っています。

モデル特徴

RLAIFトレーニング
AIフィードバック強化学習(RLAIF)を使用してファインチューニングされ、モデルの対話と推論能力が向上しました。
高性能
MT BenchでGPT-4を審査員として8.09点を獲得し、OpenAIのGPT-4とGPT-4 Turboを除くすべての既存モデルを凌駕しました。
オープンソース
モデル、ランキングデータセット、報酬モデルはすべてオープンソース化されており、研究や応用が容易です。

モデル能力

テキスト生成
対話システム
推論タスク

使用事例

対話システム
インテリジェントカスタマーサポート
高性能なインテリジェントカスタマーサポートシステムの構築に使用され、自然で流暢な対話体験を提供します。
教育
学習アシスタント
学生の質問に答え、学習アドバイスやリソースの推奨を提供します。
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase