S

Swallow 7b Instruct Hf

由tokyotech-llm開發
基於Llama 2系列優化的日語增強型大語言模型,通過監督式微調提升指令跟隨能力
下載量 1,938
發布時間 : 12/7/2023

模型概述

燕子模型是東京工業大學LLM團隊開發的日語優化大語言模型,在Llama 2基礎上通過持續預訓練和指令微調增強日語處理能力,支持日英雙語任務。

模型特點

日語優化詞表
擴展了日語專用token,顯著提升日語文本編碼效率
雙語支持
同時支持日語和英語任務處理
指令微調
通過監督式微調(SFT)增強指令理解和執行能力

模型能力

日語文本生成
英語文本生成
常識推理
開放問答
閱讀理解
摘要生成
數學推理
機器翻譯

使用案例

教育
日語學習助手
幫助學生理解日語語法和詞彙
在JCommonsenseQA日語常識測試中準確率達48.08%
內容創作
日語文章生成
根據提示生成連貫的日語文章
在XL-Sum摘要任務中得分18.30%
翻譯服務
日英互譯
實現日語和英語之間的互譯
WMT20英日翻譯BLEU得分25.10%
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase