S

Shisa V1 Llama3 8b

由shisa-ai開發
基於Meta-Llama-3-8B-Instruct微調的日語優化大語言模型,在多個日語基準測試中表現優異
下載量 28
發布時間 : 5/21/2024

模型概述

這是一個針對日語優化的8B參數大語言模型,基於Llama 3架構微調,在ELYZA100、日語MT-Bench等日語評估基準上取得良好成績

模型特點

日語優化
專門針對日語任務進行優化,日語字符佔比達91%以上
多基準表現優異
在ELYZA100、日語MT-Bench、Rakuda等多個日語評估基準上超越同類模型
精細調優
通過不同學習率實驗確定8e-6為最優參數,避免過擬合

模型能力

日語文本生成
日語問答
日語文本理解
多輪對話

使用案例

日語NLP應用
日語客服機器人
用於處理日語客戶諮詢
在Rakuda基準上得分7.05,優於多數同類模型
日語內容創作
生成符合日語表達習慣的文本內容
日語字符佔比91.3%,表達自然度較高
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase