vicuna - 68m開源推測模型 - 基於LLaMA微調，助力開發應用！

首頁

Vicuna 68m

由double7開發

這是一個6800萬參數的類Vicuna模型，基於LLaMA-68m在ShareGPT數據上微調，主要用於作為推測模型開發。

大型語言模型

Transformers

英語開源協議:Apache-2.0 #小型推測模型 #Vicuna對齊優化 #LLaMA微調

下載量 1,935

發布時間 : 1/11/2024

模型概述

該模型是基於LLaMA-68m架構在ShareGPT對話數據上微調的小型語言模型，旨在保持與LLaMA和Vicuna模型的對齊性，特別適合作為推測模型使用。

模型特點

小型高效

僅6800萬參數，計算資源需求低，適合作為推測模型使用

雙重對齊

同時保持與LLaMA和Vicuna模型的對齊性

對話優化

在ShareGPT對話數據上微調，適合對話生成任務

模型能力

文本生成

對話生成

語言理解

使用案例

推測解碼

MCSD論文中的基礎模型

作為小型推測模型與大型目標模型配合使用

相比原始LLaMA-68m，能更好地與Vicuna模型對齊

對話系統

輕量級對話代理

適用於資源受限環境下的對話生成

草稿模型	目標模型	對齊情況
LLaMA-68/160M	LLaMA-13/33B	😃
LLaMA-68/160M	Vicuna-13/33B	😟
Vicuna-68/160M	LLaMA-13/33B	😃
Vicuna-68/160M	Vicuna-13/33B	😃

精選推薦AI模型

Llama 3 Typhoon V1.5x 8b Instruct

專為泰語設計的80億參數指令模型，性能媲美GPT-3.5-turbo，優化了應用場景、檢索增強生成、受限生成和推理任務

Cadet-Tiny是一個基於SODA數據集訓練的超小型對話模型，專為邊緣設備推理設計，體積僅為Cosmo-3B模型的2%左右。

Roberta Base Chinese Extractive Qa

基於RoBERTa架構的中文抽取式問答模型，適用於從給定文本中提取答案的任務。

智啟未來，您的人工智能解決方案智庫

Vicuna 68m

模型概述

模型特點

模型能力

使用案例

🚀 小型類Vicuna模型

🚀 快速開始

✨ 主要特性

📚 詳細文檔

模型描述

對齊情況對比

📄 許可證