LLaMAntino-2-7b-hf-ITA開源大語言模型 - 免費部署專注意大利語文本生成

首頁

Llamantino 2 7b Hf ITA

由swap-uniba開發

基於LLaMA 2的意大利語適配大語言模型，專注於意大利語文本生成任務

大型語言模型

Transformers

其他#意大利語生成 #QLoRA微調 #低資源優化

下載量 4,696

發布時間 : 12/14/2023

模型概述

LLaMAntino-2-7b是一款針對意大利語優化的文本生成模型，採用QLora技術訓練，旨在為意大利語NLP研究者提供基礎模型支持

模型特點

意大利語優化

專門針對意大利語進行適配和訓練，優化了意大利語文本生成能力

QLora微調技術

採用高效的QLora技術進行微調，在保持性能的同時降低資源需求

高質量訓練數據

基於clean_mc4_it medium數據集訓練，確保數據質量

模型能力

意大利語文本生成

自然語言理解

上下文感知生成

使用案例

學術研究

意大利語NLP研究

為意大利語自然語言處理研究提供基礎模型

內容創作

意大利語內容生成

自動生成意大利語文章、故事等內容

🚀 LLaMAntino-2-7b-ITA模型介紹

LLaMAntino-2-7b-ITA是一款意大利語適配的大語言模型，基於LLaMA 2開發。它為意大利的自然語言處理研究者提供了用於自然語言生成任務的基礎模型。

🚀 快速開始

以下是使用該模型的示例代碼：

基礎用法

from transformers import AutoModelForCausalLM, AutoTokenizer

model_id = "swap-uniba/LLaMAntino-2-7b-hf-ITA"

tokenizer = AutoTokenizer.from_pretrained(model_id)
model = AutoModelForCausalLM.from_pretrained(model_id)

prompt = "Scrivi qui un possibile prompt"

input_ids = tokenizer(prompt, return_tensors="pt").input_ids
outputs = model.generate(input_ids=input_ids)

print(tokenizer.batch_decode(outputs.detach().cpu().numpy()[:, input_ids.shape[1]:], skip_special_tokens=True)[0])

高級用法

如果你在加載模型時遇到問題，可以嘗試以量化方式加載：

model = AutoModelForCausalLM.from_pretrained(model_id, load_in_8bit=True)

⚠️ 重要提示

上述模型加載策略需要安裝 bitsandbytes 和 accelerate 庫。

✨ 主要特性

意大利語適配：專為意大利語自然語言處理任務設計，為意大利的研究者提供了更貼合需求的基礎模型。
基於QLora訓練：使用QLora方法進行訓練，提高了模型的性能和效率。

📦 安裝指南

文檔中未提及具體安裝步驟，暫不提供。

📚 詳細文檔

模型信息

屬性	詳情
模型類型	LLaMA 2
訓練數據	clean_mc4_it medium
開發者	Pierpaolo Basile、Elio Musacchio、Marco Polignano、Lucia Siciliani、Giuseppe Fiameni、Giovanni Semeraro
資助項目	PNRR項目FAIR - Future AI Research
計算基礎設施	Leonardo超級計算機
語言	意大利語
許可證	Llama 2 Community License
微調基礎模型	meta-llama/Llama-2-7b-hf

訓練代碼

如果你對訓練過程的更多細節感興趣，可以在以下鏈接找到我們使用的代碼：

倉庫地址：https://github.com/swapUniba/LLaMAntino

⚠️ 重要提示

代碼尚未發佈，我們對延遲表示歉意，代碼將盡快上線！

🔧 技術細節

文檔中未提供具體技術細節，暫不展示。

📄 許可證

📄 引用信息

如果你在研究中使用了該模型，請引用以下內容：

@misc{basile2023llamantino,
      title={LLaMAntino: LLaMA 2 Models for Effective Text Generation in Italian Language}, 
      author={Pierpaolo Basile and Elio Musacchio and Marco Polignano and Lucia Siciliani and Giuseppe Fiameni and Giovanni Semeraro},
      year={2023},
      eprint={2312.09993},
      archivePrefix={arXiv},
      primaryClass={cs.CL}
}