Vicuna - 68mオープンソース推論モデル - LLaMAをベースにファインチューニング。アプリケーション開発をサポート！

ホーム

Vicuna 68m

double7によって開発

これは6800万パラメータのVicuna類似モデルで、LLaMA-68mをShareGPTデータでファインチューニングしたもので、主に推測モデル開発用として使用されます。

大規模言語モデル

Transformers

英語オープンソースライセンス:Apache-2.0 #小型推測モデル #Vicunaアライメント最適化 #LLaMAファインチューニング

ダウンロード数 1,935

リリース時間 : 1/11/2024

モデル概要

このモデルはLLaMA-68mアーキテクチャを基にShareGPTの対話データでファインチューニングした小型言語モデルで、LLaMAとVicunaモデルとのアライメントを維持することを目的としており、特に推測モデルとして使用するのに適しています。

モデル特徴

小型で効率的

わずか6800万パラメータで計算リソース要求が低く、推測モデルとして使用するのに適しています

二重アライメント

LLaMAとVicunaモデルの両方とのアライメントを同時に維持

対話最適化

ShareGPTの対話データでファインチューニングされており、対話生成タスクに適しています

モデル能力

テキスト生成

対話生成

言語理解

使用事例

推測デコード

MCSD論文のベースモデル

小型推測モデルとして大型ターゲットモデルと組み合わせて使用

オリジナルのLLaMA-68mと比較して、Vicunaモデルとのアライメントがより良好

対話システム

軽量対話エージェント

リソースが制限された環境での対話生成に適しています

ドラフトモデル	ターゲットモデル	アライメント
LLaMA-68/160M	LLaMA-13/33B	😃
LLaMA-68/160M	Vicuna-13/33B	😟
Vicuna-68/160M	LLaMA-13/33B	😃
Vicuna-68/160M	Vicuna-13/33B	😃

おすすめAIモデル

Llama 3 Typhoon V1.5x 8b Instruct

タイ語専用に設計された80億パラメータの命令モデルで、GPT-3.5-turboに匹敵する性能を持ち、アプリケーションシナリオ、検索拡張生成、制限付き生成、推論タスクを最適化

Cadet-TinyはSODAデータセットでトレーニングされた超小型対話モデルで、エッジデバイス推論向けに設計されており、体積はCosmo-3Bモデルの約2％です。

Roberta Base Chinese Extractive Qa

RoBERTaアーキテクチャに基づく中国語抽出型QAモデルで、与えられたテキストから回答を抽出するタスクに適しています。

質問応答システム中国語

uer

2,694

未来を切り開く、あなたのAIソリューション知識ベース

English 简体中文繁體中文にほんご

Vicuna 68m

モデル概要

モデル特徴

モデル能力

使用事例

🚀 小型Vicunaライクモデル

🚀 クイックスタート

📚 ドキュメント

モデルの詳細

モデルのアライメント比較

📄 ライセンス