llama-68m開源小型語言模型 - 助力推測推理研究，免費使用！

首頁

Llama 68m

由JackFram開發

這是一個類似LLaMA的小型語言模型，包含6800萬參數，主要用於SpecInfer論文中的推測推理研究。

大型語言模型

Transformers

英語開源協議:Apache-2.0 #小型文本生成 #推測推理加速 #維基百科訓練

下載量 573.35k

發布時間 : 7/19/2023

模型概述

基於維基百科和部分C4數據集訓練的輕量級語言模型，作為SpecInfer論文中的基礎推測模型開發。

模型特點

輕量級設計

僅6800萬參數的小型模型，適合作為推測推理的基礎模型

多數據源訓練

結合維基百科、C4-en和C4-realnewslike數據集進行訓練

研究導向

專為SpecInfer論文中的推測推理和令牌樹驗證研究設計

模型能力

英文文本生成

使用案例

學術研究

推測推理研究

作為SpecInfer論文中的基礎小型推測模型

用於驗證推測推理和令牌樹驗證方法的有效性

輕量級應用

資源受限環境下的文本生成

在計算資源有限的情況下提供基本的文本生成能力

屬性	詳情
模型類型	文本生成模型
訓練數據	維基百科、部分C4-en和C4-realnewslike數據集

精選推薦AI模型

Llama 3 Typhoon V1.5x 8b Instruct

專為泰語設計的80億參數指令模型，性能媲美GPT-3.5-turbo，優化了應用場景、檢索增強生成、受限生成和推理任務

Cadet-Tiny是一個基於SODA數據集訓練的超小型對話模型，專為邊緣設備推理設計，體積僅為Cosmo-3B模型的2%左右。

Roberta Base Chinese Extractive Qa

基於RoBERTa架構的中文抽取式問答模型，適用於從給定文本中提取答案的任務。

智啟未來，您的人工智能解決方案智庫

Llama 68m

模型概述

模型特點

模型能力

使用案例

🚀 小型類LLaMA模型

🚀 快速開始

📚 詳細文檔

模型描述

引用信息

模型信息

重要提示

📄 許可證