V

Vietnamese Llama2 7b 40GB

由bkai-foundation-models開發
基於Llama2-chat 7B的越南語優化模型,通過增量預訓練和高效分詞器顯著提升越南語處理能力
下載量 23
發布時間 : 10/26/2023

模型概述

該模型是針對越南語優化的Llama2變體,通過重新訓練分詞器和持續預訓練,顯著提高了越南語文本編碼效率,適用於越南語自然語言處理任務

模型特點

高效越南語分詞
採用SentencePiece訓練專用分詞器,越南語編碼效率比原始Llama2提升70%
混合數據訓練
使用40.5GB混合數據集(越南新聞、維基、法律文檔及英文數據)進行增量預訓練
LoRA適配
採用低秩適應(LoRA)技術進行高效訓練,提供獨立LoRA模塊便於集成

模型能力

越南語文本生成
英語文本生成
跨語言理解

使用案例

內容生成
越南語新聞生成
基於新聞語料訓練,可生成符合越南語習慣的新聞內容
法律輔助
法律文檔處理
基於大量越南法律文本訓練,適合法律文檔分析和生成
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase