開源Llama-3.2-400M-Amharic模型 - 專用於阿姆哈拉語處理，便捷實用！

首頁

Llama 3.2 400M Amharic

由rasyosef開發

這是一個基於Meta公司Llama-3.2-1B模型的精簡版本，專門針對阿姆哈拉語進行預訓練，包含4億參數，上下文長度為1024個標記。

大型語言模型

Transformers

其他#阿姆哈拉語生成 #小規模預訓練 #非洲語言模型

下載量 310

發布時間 : 11/26/2024

模型概述

該模型是一個解碼器變壓器模型，專門用於阿姆哈拉語的文本生成任務，未經過監督微調。

模型特點

阿姆哈拉語優化

使用2.74億個阿姆哈拉語文本標記進行預訓練，專門優化了阿姆哈拉語的文本生成能力。

精簡模型

基於Llama-3.2-1B模型的精簡版本，參數規模為4億，適合在單塊A100 40GB顯卡上運行。

高效訓練

在單塊A100 40GB顯卡上僅用23小時完成預訓練，驗證困惑度為41.3。

模型能力

阿姆哈拉語文本生成

長文本生成（1024標記上下文長度）

使用案例

文本生成

新聞摘要生成

根據阿姆哈拉語新聞標題生成新聞摘要

生成連貫且符合語境的新聞內容

對話系統

用於阿姆哈拉語聊天機器人的回覆生成

生成自然流暢的對話回覆

🚀 Llama 3.2 400M阿姆哈拉語模型

本項目是Meta公司Llama-3.2-1B解碼器Transformer模型的較小版本。該模型使用單張A100 40GB GPU，基於2.74億個阿姆哈拉語文本標記，從頭開始預訓練了23小時。

模型信息

屬性	詳情
模型類型	Llama 3.2 400M阿姆哈拉語模型
訓練數據	2.74億個阿姆哈拉語文本標記
參數數量	4億個參數
上下文大小	1024個標記
分詞器	與Llama-3.2-1B使用相同的分詞器，基於相同的阿姆哈拉語數據集從頭訓練，詞彙量為32k
驗證困惑度	41.3
模型狀態	基礎模型，尚未進行任何有監督微調

🚀 快速開始

📦 安裝指南

首先，你需要安裝最新版本的transformers庫：

pip install -Uq transformers

💻 使用示例

基礎用法

你可以使用pipeline直接調用該模型進行文本生成：

from transformers import pipeline

llama_am = pipeline(
    "text-generation",
    model="rasyosef/Llama-3.2-400M-Amharic",
    device_map="auto"
  )

prompt = "አዲስ አበባ"
llama_am(
    prompt,
    max_new_tokens=128,
    temperature=0.5,
    do_sample=True,
    top_k=8,
    top_p=0.8,
    repetition_penalty=1.2
  )

輸出示例

[{'generated_text': 'አዲስ አበባ፣ ታህሳስ 8 ፣2012 (ኤፍ ቢ ሲ) የኢፌዴሪ የውጭ ጉዳይ ሚኒስትር አቶ ገዱ አንዳርጋቸው ከአፍሪካ ህብረት የስራ አስፈጻሚዎች ምክር ቤት መደበኛ ስብሰባ ጎን ለጎን ከዴሞክራቲክ ሪፐብሊክ ኮንጎ አቻቸው ማሪ ቱምባ ንዜዛ እና ከሌሎች የአፍሪካ አምባሳደሮች ጋር ተወያይተዋል።በውይይታቸውም በአፍሪካ የኮሮና ቫይረስን ለመከላከል እየተከናወኑ ባሉ ስራዎች ዙሪያ መምከራቸውን በትዊተር ገጻቸው አስፍረዋል።የሁለቱን ሀገራት ግንኙነት በተመለከተም፥ ኢትዮጵያ በህብረቱ ቋሚ አምባሳደርነት ባላት ሀላፊነት ለሹመት ማቅረብዋ የሚደነቅ መሆኑንም አንስተዋል።ኢትዮጵያ የኮቪድ19 ወረርሽኝን ለመግታት እያደረገች ባለው ጥረት ለደቡብ አፍሪካ ምስጋና አቅርባም ነበር፤ ቫይረሱን ለመቆጣጠር ከኢትዮጵያ ምን እንደምትማር በዝርዝር ላቀረብንላቸው ጥያቄም ወደፊት በሚሰሩ የትብብር መስኮች ላይ ተነጋግረን መስራት እንፈልጋለን ብለዋል።በቀጣይም ሁለቱ'}]