TinyLlama-1.1B-32k開源模型 - 免費使用，處理超長上下文內容超給力

首頁

Tinyllama 1.1B 32k

由Doctor-Shotgun開發

基於TinyLlama-1.1B的32k上下文微調版本，通過增大rope theta實現長上下文處理能力

大型語言模型

Transformers

英語開源協議:Apache-2.0 #長上下文推理 #推測解碼優化 #高效微調

下載量 51

發布時間 : 12/29/2023

模型概述

這是一個針對長上下文優化的語言模型，通過調整rope頻率基數實現32k上下文長度支持，適合作為推測解碼模型使用

模型特點

長上下文支持

通過調整rope theta參數支持32k上下文長度

高效推理

量化版本可在單張A6000顯卡上運行，適合推測解碼

優化預訓練

在RedPajama-Data-1T-Sample數據集上進行了32k上下文長度的預訓練

模型能力

長文本生成

代碼生成

文本理解

使用案例

代碼生成

編程輔助

用於生成和補全代碼

HumanEval評估顯示Pass@1達到0.0829

長文本處理

長文檔分析

處理長達32k token的文本內容

在32768長度下困惑度7.1338

模型	2048	4096	8192	16384	32768
TinyLlama-1.1B	8.5633	208.3586	863.7507	1600.5021	6981.9021
TinyLlama-1.1B-32k	8.6548	7.8339	7.4904	7.3674	7.1338

模型	Pass@1	Pass@10
TinyLlama-1.1B	0.0841	0.1524
TinyLlama-1.1B (NTK alpha=7.7)	0.0598	0.1098
TinyLlama-1.1B-32k-ckpt-554	0.0732	0.1402
TinyLlama-1.1B-32k	0.0829	0.1524

精選推薦AI模型

Llama 3 Typhoon V1.5x 8b Instruct

專為泰語設計的80億參數指令模型，性能媲美GPT-3.5-turbo，優化了應用場景、檢索增強生成、受限生成和推理任務

Cadet-Tiny是一個基於SODA數據集訓練的超小型對話模型，專為邊緣設備推理設計，體積僅為Cosmo-3B模型的2%左右。

Roberta Base Chinese Extractive Qa

基於RoBERTa架構的中文抽取式問答模型，適用於從給定文本中提取答案的任務。

智啟未來，您的人工智能解決方案智庫

Tinyllama 1.1B 32k

模型概述

模型特點

模型能力

使用案例

🚀 TinyLlama-1.1B-32k

✨ 主要特性

模型評估

Wikitext 數據集困惑度（wikitext-2-raw-v1_train，64 行），通過 exllamav2 評估：

由 turboderp 在 HumanEval 數據集上的評估：

📄 許可證