bangla-llama-7b-base-v0.1開源大模型 - 免費部署助力孟加拉語文本生成理解

Bangla Llama 7b Base V0.1

由BanglaLLM開發

這是首個基於LLaMA-2架構的70億參數孟加拉語大語言模型，專為孟加拉語文本生成和理解任務設計

下載量 93

發布時間 : 2/1/2024

模型概述

該模型是在LLaMA-2基礎上擴展了孟加拉語詞彙庫的因果語言模型，主要用於孟加拉語文本生成任務，也可作為基礎模型進行進一步微調

擴展孟加拉語詞彙

在原始LLaMA-2基礎上新增了16,000個孟加拉語token，顯著提升對孟加拉語的理解和生成能力

雙語支持

同時支持孟加拉語和英語處理，適合雙語應用場景

可微調基礎

作為基礎模型，為特定NLP任務的進一步微調提供了良好起點

孟加拉語文本生成

英語文本生成

語言理解

文本續寫

自然語言處理

孟加拉語文本生成

生成連貫的孟加拉語文本內容

語言模型研究

作為研究孟加拉語大語言模型的基礎平臺

孟加拉語LLaMA 7B基礎模型的首次發佈是推進孟加拉語大語言模型發展的重要一步。該模型可立即用於推理，也可進一步微調以滿足您特定的自然語言處理任務需求。

⚠️ 重要提示

此模型標記為基礎孟加拉語語言模型（LLM），主要用於因果語言建模（LM）。換句話說，如果您正在尋找一個能遵循指令的孟加拉語模型，BanglaLLM/Bangla-llama-7b-instruct-v0.1 可能更適合您的需求。

本模型可直接用於推理，也可以根據您的特定NLP任務進行進一步的微調。

孟加拉語LLaMA模型在原始LLaMA - 2的基礎上進行了增強和定製，擁有16,000個標記的廣泛孟加拉語詞彙表。

屬性	詳情
模型類型	一個具有70億參數的因果語言模型，在 CulturaX 數據集的孟加拉語子集上進行了預訓練。
語言	孟加拉語和英語
許可證	GNU通用公共許可證v3.0
源模型	meta-llama/Llama-2-7b-hf
訓練精度	`float16`
代碼	GitHub