E

Elastic Llama 3.2 1B Instruct

由TheStageAI開發
自託管場景下最快最靈活的模型,通過滑動控制條可自由調節模型體積、推理延遲與質量平衡
下載量 65
發布時間 : 4/14/2025

模型概述

由TheStage AI ANNA生成的優化模型系列,提供四種不同優化級別的版本(XL/L/M/S),在自託管場景下實現最佳性能與質量平衡

模型特點

彈性調節
通過簡單滑動控制條可自由調節模型體積、推理延遲與質量平衡
多版本優化
提供XL/L/M/S四種優化版本,分別對應不同級別的速度與精度平衡
硬件兼容
支持多硬件平臺(H100/L40s GPU和AMD/Intel CPU),預編譯免JIT
無縫集成
單行代碼即可兼容HuggingFace transformers生態

模型能力

多語言文本生成
指令跟隨
知識問答
內容創作

使用案例

搜索引擎增強
智能問答系統
作為搜索引擎後端提供精準答案
在MMLU基準測試中達到45.5-46.2分
企業知識管理
內部知識庫問答
快速響應員工對企業政策/流程的查詢
在PIQA常識測試中達到73.1-74.3分
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase