首頁

Phi 3.5 Mini ITA

由anakin87開發

基於Microsoft/Phi-3.5-mini-instruct微調的版本，優化了意大利語性能的小型但強大的語言模型

大型語言模型

Transformers

支持多種語言開源協議:MIT #意大利語優化 #小參數高效 #128k長文本

下載量 8,495

發布時間 : 8/23/2024

模型概述

Phi-3.5-mini-ITA是一個針對意大利語優化的語言模型，基於Microsoft的Phi-3.5-mini-instruct微調而來，支持意大利語和英語，適用於文本生成任務。

模型特點

意大利語優化

專門針對意大利語性能進行了優化，在意大利語任務上表現優異

小巧高效

僅3.82億參數，但性能強大，可在消費級硬件上運行

長上下文支持

支持128k的上下文長度，適合處理長文檔

兼容Flash Attention 2

支持Flash Attention 2加速推理

模型能力

意大利語文本生成

英語文本生成

多輪對話

指令跟隨

使用案例

教育

意大利語語法解釋

解釋意大利語語法規則，如時態區別

能準確解釋未完成時和近過去時的區別及使用場景

聊天機器人

意大利語對話系統

構建意大利語聊天機器人

內容生成

意大利語內容創作

生成意大利語文章、故事等內容

許可協議: mit
數據集:

mlabonne/FineTome-100k
efederici/capybara-claude-15k-ita
語言:
意大利語
英語
庫名稱: transformers
流水線標籤: 文本生成
基礎模型: microsoft/Phi-3.5-mini-instruct
標籤:
trl
phi3
spectrum

Phi-3.5-mini-ITA

基於Microsoft/Phi-3.5-mini-instruct微調的版本，優化了意大利語性能。

🔹 小巧但強大的模型，擁有38.2億參數
🔹 支持128k上下文長度

🏋️‍♂️ 想了解模型是如何訓練的嗎？
查看📖 完整教程文章及配套的💻 筆記本

🏆 評估

意大利語LLM公開排行榜

模型	參數	平均分	MMLU_IT	ARC_IT	HELLASWAG_IT
anakin87/Phi-3.5-mini-ITA	3.82 B	57.67	59.93	51.5	61.57
meta-llama/Meta-Llama-3.1-8B-Instruct	8.03 B	56.97	58.43	48.42	64.07
microsoft/Phi-3.5-mini-instruct	3.82 B	56.82	60.03	49.19	61.25

詳情

Pinocchio意大利語排行榜

模型	參數	平均分
anakin87/Phi-3.5-mini-ITA	3.82 B	57.95
meta-llama/Meta-Llama-3.1-8B-Instruct	8.03 B	56.93

詳情

🎮 模型實戰

演示

💬🇮🇹 在Hugging Face Spaces上與模型聊天

使用Transformers生成文本

模型小巧，可在Colab上流暢運行。也可使用量化加載模型。

使用transformers==4.44.2時，需設置trust_remote_code=True以修復Phi3ForCausalLM中的小問題。
詳情參閱此討論。

⚡ 模型兼容Flash Attention 2，可加速推理。啟用需取消下方代碼片段中attn_implementation參數的註釋。

# pip install transformers accelerate  
import torch  
from transformers import pipeline, AutoModelForCausalLM, AutoTokenizer  

model_id="anakin87/Phi-3.5-mini-ITA"  

model = AutoModelForCausalLM.from_pretrained(  
    model_id,   
    device_map="auto",  
    torch_dtype=torch.bfloat16,  
    trust_remote_code=True,  
    # attn_implementation="flash_attention_2",  # 取消註釋以使用Flash Attention 2  
)  
tokenizer = AutoTokenizer.from_pretrained(model_id, trust_remote_code=True)  

pipe = pipeline("text-generation", model=model, tokenizer=tokenizer)  

user_input = "你能簡要解釋一下意大利語中未完成時和近過去時的區別及使用場景嗎？"  
messages = [{"role": "user", "content": user_input}]  
outputs = pipe(user_input, max_new_tokens=500, do_sample=True, temperature=0.001)  
print(outputs[0]["generated_text"])

示例輸出：

當然！未完成時和近過去時是意大利語中兩種表示過去動作的時態，但含義不同。  

未完成時：  
- 用於描述過去持續或重複發生的動作  
- 表示無明確終點的動作或習慣性行為  
- 常用於描述過去的狀態或情境  
- 例："小時候我常在公園玩耍"  

近過去時：  
- 用於描述已完成的過去動作  
- 表示發生在特定時間點的動作  
- 常用於描述有明確持續時間的事件  
- 例："昨天我讀完了那本書"  

簡言之，未完成時描述過去持續/習慣性動作，近過去時描述已完成的特定動作。