Dolphin 2.9 Llama3 70b Awq
D
Dolphin 2.9 Llama3 70b Awq
由julep-ai開發
Dolphin 2.9 Llama3 70B 的 AWQ 量化版本,適用於 vllm 和其他推理引擎。
下載量 19
發布時間 : 5/3/2024
模型概述
該模型是基於 Llama3 70B 架構的大語言模型,經過 AWQ 量化處理,優化了推理速度和資源消耗,適用於各種文本生成和理解任務。
模型特點
AWQ 量化
通過 AWQ 量化技術優化模型,減少內存佔用和計算資源需求,同時保持較高的推理精度。
高性能推理
適用於 vllm 和其他推理引擎,提供高效的文本生成能力。
大參數規模
基於 Llama3 70B 架構,具備強大的語言理解和生成能力。
模型能力
文本生成
對話系統
問答系統
語言理解
使用案例
自然語言處理
聊天機器人
用於構建高性能的對話系統,提供流暢的交互體驗。
內容生成
生成高質量的文章、摘要或其他文本內容。
教育
智能問答
用於教育領域的問答系統,解答學生的問題。
精選推薦AI模型
Llama 3 Typhoon V1.5x 8b Instruct
專為泰語設計的80億參數指令模型,性能媲美GPT-3.5-turbo,優化了應用場景、檢索增強生成、受限生成和推理任務
大型語言模型
Transformers 支持多種語言

L
scb10x
3,269
16
Cadet Tiny
Openrail
Cadet-Tiny是一個基於SODA數據集訓練的超小型對話模型,專為邊緣設備推理設計,體積僅為Cosmo-3B模型的2%左右。
對話系統
Transformers 英語

C
ToddGoldfarb
2,691
6
Roberta Base Chinese Extractive Qa
基於RoBERTa架構的中文抽取式問答模型,適用於從給定文本中提取答案的任務。
問答系統 中文
R
uer
2,694
98