S

Stable Vicuna 13b Delta

Developed by CarperAI
StableVicuna-13BはVicuna-13B v0モデルを基に、人間のフィードバックによる強化学習(RLHF)と近接方策最適化(PPO)を用いて、様々な対話および命令データセットで微調整されたモデルです。
Downloads 31
Release Time : 4/26/2023

Model Overview

StableVicuna-13BはLLaMAトランスフォーマーアーキテクチャに基づく自己回帰型言語モデルで、対話タスクに特化したテキスト生成を行います。

Model Features

強化学習による微調整
人間のフィードバックによる強化学習(RLHF)と近接方策最適化(PPO)を用いて、様々な対話および命令データセットで微調整されています。
複数データセットでの学習
OpenAssistant、GPT4All、Alpacaなどの高品質なデータセットで学習されています。
対話最適化
対話タスクに特化したテキスト生成が可能で、一貫性があり意味のある対話応答を生成できます。

Model Capabilities

テキスト生成
対話システム
命令追従

Use Cases

対話システム
インテリジェントアシスタント
ユーザーの命令や質問を理解し、応答するインテリジェントアシスタントの構築に使用できます。
テキスト生成
コード生成
ユーザーの命令に基づいてPythonスクリプトなどのコードスニペットを生成します。
AIbase
Empowering the Future, Your AI Solution Knowledge Base
© 2025AIbase