tamil-llama-7b-base-v0.1開源泰米爾語大模型 - 支持多語言因果語言建模

首頁

Tamil Llama 7b Base V0.1

由abhinand開發

基於LLaMA-2架構的70億參數泰米爾語大語言模型，支持泰米爾語和英語的因果語言建模

大型語言模型

Transformers

支持多種語言#泰米爾語生成 #多語言LLM #低資源優化

下載量 761

發布時間 : 11/8/2023

模型概述

這是首個專門針對泰米爾語開發的大語言模型基礎版本，可直接用於推理或作為下游任務的預訓練基礎

模型特點

泰米爾語專用詞表

擴展了包含16,000個泰米爾語詞彙的專用詞表，顯著提升泰米爾語處理能力

雙語支持

同時支持泰米爾語和英語處理，適合多語言應用場景

開源許可

採用GNU通用公共許可證v3.0，允許商業和研究用途

模型能力

泰米爾語文本生成

英語文本生成

語言建模

文本續寫

使用案例

語言處理

泰米爾語內容生成

自動生成符合語法的泰米爾語文本內容

語言模型研究

作為泰米爾語NLP研究的預訓練基礎模型

🚀 泰米爾語LLaMA 7B基礎模型v0.1 [預訓練]

泰米爾語LLaMA 7B基礎模型的首個版本正式發佈啦！這是推動泰米爾語大語言模型發展的重要一步。該模型可立即用於推理，也適合進一步微調以滿足您特定的自然語言處理任務需求。

若您想深入瞭解該模型的開發過程和能力，請閱讀研究論文和介紹博客文章（待完成），其中概述了我們的研發歷程以及該模型可能產生的影響。

⚠️ 重要提示

此模型為基礎泰米爾語語言模型（LLM），主要用於因果語言建模（LM）。如果您需要一個遵循指令的泰米爾語模型，abhinand/tamil-llama-7b-instruct-v0.1可能更適合您的需求。

✨ 主要特性

泰米爾語LLaMA模型在原始LLaMA - 2的基礎上進行了增強和定製，擁有16000個標記的豐富泰米爾語詞彙。

📚 詳細文檔

模型描述

模型類型：一個具有70億參數的因果語言模型，在CulturaX數據集的泰米爾語子集上進行了預訓練。
語言：泰米爾語和英語
許可證：GNU通用公共許可證v3.0
源模型：meta - llama/Llama - 2 - 7b - hf
訓練精度：float16
代碼：GitHub

模型	類型	數據	基礎模型	參數數量	下載鏈接
泰米爾語LLaMA 7B基礎模型	基礎模型	12GB	LLaMA 7B	70億	HF Hub
泰米爾語LLaMA 13B基礎模型	基礎模型	4GB	LLaMA 13B	130億	HF Hub
泰米爾語LLaMA 7B指令模型	遵循指令的模型	14.5萬條指令	泰米爾語LLaMA 7B基礎模型	70億	HF Hub
泰米爾語LLaMA 13B指令模型	遵循指令的模型	14.5萬條指令	泰米爾語LLaMA 13B基礎模型	130億	HF Hub

使用注意事項

需要注意的是，這些模型尚未進行去毒處理。因此，儘管它們具有出色的語言能力，但仍有可能生成有害或冒犯性的內容。我們建議用戶謹慎使用，並密切監督模型的輸出，特別是在公共或敏感應用場景中。

認識開發者

瞭解這個創新模型背後的創造者，並關注他們在該領域的貢獻：

Abhinand Balachandran

引用信息

如果您在研究中使用了此模型或泰米爾語LLaMA數據集，請引用：

@misc{balachandran2023tamilllama,
      title={Tamil-Llama: A New Tamil Language Model Based on Llama 2}, 
      author={Abhinand Balachandran},
      year={2023},
      eprint={2311.05845},
      archivePrefix={arXiv},
      primaryClass={cs.CL}
}

我們希望這個模型能成為您自然語言處理工具包中的寶貴工具，並期待看到它在泰米爾語理解和生成方面帶來的進步。