T

Tess 2.0 Llama 3 8B

由migtissera開發
Tess是Tesoro(意大利語中'寶藏'之意)的簡稱,這是一個基於meta-llama/Meta-Llama-3-8B模型進行訓練的通用型大語言模型系列。
下載量 1,835
發布時間 : 5/5/2024

模型概述

Tess-2.0-Llama-3-8B是一個通用型大語言模型,基於Llama-3架構,經過約10萬條高質量代碼和通用訓練樣本的微調,能夠高效遵循指令並提供詳細回答。

模型特點

高質量微調
基於約10萬條高質量代碼和通用訓練樣本進行微調,模型幾乎總能遵循指令。
低學習率訓練
僅進行1個epoch的低學習率微調,儘可能保持模型的信息熵。
通用型能力
適用於多種任務,包括對話、代碼生成和通用文本處理。

模型能力

文本生成
對話系統
代碼生成
指令遵循

使用案例

對話系統
智能助手
作為智能助手回答用戶問題
能提供詳細回答,幾乎總能遵循指令
代碼生成
代碼輔助
幫助開發者生成和優化代碼
基於高質量代碼樣本訓練,能生成有效代碼
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase