Vicuna-7B-Delta-V0オープンソースチャットアシスタント - 無料でデプロイしてスマートな対話交流を実現

ホーム

Vicuna 7b Delta V0

lmsysによって開発

VicunaはShareGPTで収集されたユーザー共有の会話データを使用してLLaMAをファインチューニングしてトレーニングされたチャットアシスタントです。

大規模言語モデル

Transformers

#LLaMAファインチューニングモデル #ユーザーダイアログ最適化 #非商用ライセンス

ダウンロード数 1,791

リリース時間 : 4/6/2023

モデル概要

VicunaはLLaMAモデルをベースにファインチューニングされた大規模言語モデルで、主にチャットアシスタントや自然言語処理研究に使用されます。

モデル特徴

LLaMAベースのファインチューニング

LLaMAベースモデルにShareGPTのユーザー共有会話データを使用してファインチューニング

多様な評価体系

標準ベンチマークテスト、人間の嗜好評価、LLM-as-a-judgeの3つの方法で評価

増分モデル設計

完全な機能を得るには元のLLaMA重みを適用する必要がある

モデル能力

対話生成

自然言語理解

指示追従

マルチターンダイアログ

使用事例

学術研究

大規模言語モデル研究

大規模言語モデルの動作と性能を研究するために使用

チャットボット研究

チャットボットシステムの開発と研究に使用

教育

NLP教育

自然言語処理と機械学習の教育に使用

🚀 Vicunaモデル

Vicunaは、ShareGPTから収集されたユーザー共有の会話データを使用してLLaMAをファインチューニングすることで学習されたチャットアシスタントです。このモデルは、大規模言語モデルやチャットボットに関する研究に役立ちます。

🚀 クイックスタート

⚠️ 重要提示

新しいバージョンが利用可能です。最新バージョンの重みについてはこちらを確認してください。

⚠️ 重要提示

この「deltaモデル」は直接使用することはできません。ユーザーは、実際のVicunaの重みを取得するために、元のLLaMAの重みにこのdeltaモデルを適用する必要があります。詳細な手順はこちらを参照してください。

モデルの使用開始方法

コマンドラインインターフェース: https://github.com/lm-sys/FastChat#vicuna-weights
API (OpenAI API, Huggingface API): https://github.com/lm-sys/FastChat/tree/main#api

✨ 主な機能

Vicunaの主な用途は、大規模言語モデルとチャットボットの研究です。このモデルの主な対象ユーザーは、自然言語処理、機械学習、人工知能の研究者や愛好家です。

📦 インストール

コマンドラインインターフェースやAPIを通じてモデルを使用する方法については、以下のリンクを参照してください。

コマンドラインインターフェース: https://github.com/lm-sys/FastChat#vicuna-weights
API (OpenAI API, Huggingface API): https://github.com/lm-sys/FastChat/tree/main#api

📚 ドキュメント

モデルの詳細

属性	详情
開発者	LMSYS
モデルタイプ	トランスフォーマーアーキテクチャに基づく自己回帰型言語モデル
ライセンス	非商用ライセンス
ファインチューニング元のモデル	LLaMA

モデルのソース

リポジトリ: https://github.com/lm-sys/FastChat
ブログ: https://lmsys.org/blog/2023-03-30-vicuna/
論文: https://arxiv.org/abs/2306.05685
デモ: https://chat.lmsys.org/

トレーニングの詳細

Vicuna v0は、教師付き命令微調整によってLLaMAからファインチューニングされています。トレーニングデータは、ShareGPT.comから収集された約70Kの会話です。詳細は、この論文の付録にある「Vicunaモデルのトレーニング詳細」のセクションを参照してください。

評価

Vicunaは、標準的なベンチマーク、人間の嗜好、およびLLMを評価者として使用して評価されています。詳細は、この論文とリーダーボードを参照してください。

異なるバージョンのVicunaの違い

詳細はvicuna_weights_version.mdを参照してください。

おすすめAIモデル

Llama 3 Typhoon V1.5x 8b Instruct

タイ語専用に設計された80億パラメータの命令モデルで、GPT-3.5-turboに匹敵する性能を持ち、アプリケーションシナリオ、検索拡張生成、制限付き生成、推論タスクを最適化

Cadet-TinyはSODAデータセットでトレーニングされた超小型対話モデルで、エッジデバイス推論向けに設計されており、体積はCosmo-3Bモデルの約2％です。

Roberta Base Chinese Extractive Qa

RoBERTaアーキテクチャに基づく中国語抽出型QAモデルで、与えられたテキストから回答を抽出するタスクに適しています。

質問応答システム中国語

uer

2,694

未来を切り開く、あなたのAIソリューション知識ベース

English 简体中文繁體中文にほんご