Vicuna 7b Delta V0
VicunaはShareGPTで収集されたユーザー共有の会話データを使用してLLaMAをファインチューニングしてトレーニングされたチャットアシスタントです。
ダウンロード数 1,791
リリース時間 : 4/6/2023
モデル概要
VicunaはLLaMAモデルをベースにファインチューニングされた大規模言語モデルで、主にチャットアシスタントや自然言語処理研究に使用されます。
モデル特徴
LLaMAベースのファインチューニング
LLaMAベースモデルにShareGPTのユーザー共有会話データを使用してファインチューニング
多様な評価体系
標準ベンチマークテスト、人間の嗜好評価、LLM-as-a-judgeの3つの方法で評価
増分モデル設計
完全な機能を得るには元のLLaMA重みを適用する必要がある
モデル能力
対話生成
自然言語理解
指示追従
マルチターンダイアログ
使用事例
学術研究
大規模言語モデル研究
大規模言語モデルの動作と性能を研究するために使用
チャットボット研究
チャットボットシステムの開発と研究に使用
教育
NLP教育
自然言語処理と機械学習の教育に使用
おすすめAIモデル
Llama 3 Typhoon V1.5x 8b Instruct
タイ語専用に設計された80億パラメータの命令モデルで、GPT-3.5-turboに匹敵する性能を持ち、アプリケーションシナリオ、検索拡張生成、制限付き生成、推論タスクを最適化
大規模言語モデル
Transformers 複数言語対応

L
scb10x
3,269
16
Cadet Tiny
Openrail
Cadet-TinyはSODAデータセットでトレーニングされた超小型対話モデルで、エッジデバイス推論向けに設計されており、体積はCosmo-3Bモデルの約2%です。
対話システム
Transformers 英語

C
ToddGoldfarb
2,691
6
Roberta Base Chinese Extractive Qa
RoBERTaアーキテクチャに基づく中国語抽出型QAモデルで、与えられたテキストから回答を抽出するタスクに適しています。
質問応答システム 中国語
R
uer
2,694
98