blockchainlabs_7B開源大模型 - 經優化剪枝，適配設備端靈活使用

首頁

Blockchainlabs 7B Merged Test2 4 Prune Sft 4bit DPO Orca

由alnrg2arg開發

這是一個經過剪枝和DPO訓練的7B參數規模的小型LLM，專為設備端用途優化

大型語言模型

Transformers

英語#設備端優化 #剪枝模型 #DPO微調

下載量 18

發布時間 : 1/23/2024

模型概述

該模型是基於Mistral架構的7B參數語言模型，經過合併、剪枝(50%稀疏度)和DPO訓練流程優化，旨在保持性能的同時減少模型體積，適合部署在資源有限的設備上

模型特點

設備端優化

通過50%稀疏度剪枝顯著減小模型體積，適合資源有限的設備部署

DPO訓練

使用直接偏好優化(DPO)方法進行訓練，提高模型輸出質量

高效推理

採用8bit優化和AdamW優化器，提高推理效率

模型能力

英文文本生成

指令跟隨

對話生成

使用案例

移動應用

設備端聊天助手

在智能手機等移動設備上部署輕量級聊天機器人

在保持響應質量的同時減少資源佔用

邊緣計算

本地化文本處理

在邊緣設備上進行文本生成和處理，無需雲端依賴

提高隱私保護和響應速度

屬性	詳情
基礎模型	alnrg2arg/blockchainlabs_7B_merged_test2_4_prune
訓練數據集	Intel/orca_dpo_pairs
標籤	text-generation-inference、transformers、unsloth、mistral、trl

精選推薦AI模型

Llama 3 Typhoon V1.5x 8b Instruct

專為泰語設計的80億參數指令模型，性能媲美GPT-3.5-turbo，優化了應用場景、檢索增強生成、受限生成和推理任務

Cadet-Tiny是一個基於SODA數據集訓練的超小型對話模型，專為邊緣設備推理設計，體積僅為Cosmo-3B模型的2%左右。

Roberta Base Chinese Extractive Qa

基於RoBERTa架構的中文抽取式問答模型，適用於從給定文本中提取答案的任務。

智啟未來，您的人工智能解決方案智庫

Blockchainlabs 7B Merged Test2 4 Prune Sft 4bit DPO Orca

模型概述

模型特點

模型能力

使用案例

🚀 區塊鏈實驗室測試模型項目

🚀 快速開始

✨ 主要特性

💻 使用示例

基礎用法

📄 許可證

📋 模型信息