オープンソースLlama - 3.2 - 400M - アムハラ語モデル - アムハラ語処理に特化し、便利で実用的！

ホーム

Llama 3.2 400M Amharic

rasyosefによって開発

これはMeta社のLlama-3.2-1Bモデルをベースにした軽量版で、アムハラ語に特化して事前学習されており、4億のパラメータと1024トークンのコンテキスト長を持ちます。

大規模言語モデル

Transformers

その他#アムハラ語生成 #小規模事前学習 #アフリカ言語モデル

ダウンロード数 310

リリース時間 : 11/26/2024

モデル概要

このモデルはアムハラ語のテキスト生成タスクに特化したデコーダートランスフォーマーモデルで、教師あり微調整は行われていません。

モデル特徴

アムハラ語最適化

2億7400万のアムハラ語テキストトークンで事前学習され、アムハラ語のテキスト生成能力を特別に最適化しています。

軽量モデル

Llama-3.2-1Bモデルの軽量版で、4億パラメータ規模のため、単一のA100 40GB GPUで動作可能です。

効率的な学習

単一のA100 40GB GPUでわずか23時間の事前学習を完了し、検証パープレキシティは41.3でした。

モデル能力

アムハラ語テキスト生成

長文生成（1024トークンコンテキスト長）

使用事例

テキスト生成

ニュース要約生成

アムハラ語のニュース見出しからニュース要約を生成

文脈に合った一貫性のあるニュース内容を生成

対話システム

アムハラ語チャットボットの応答生成に使用

自然で流暢な会話応答を生成

🚀 Llama 3.2 400M Amharic

このモデルは、MetaのLlama - 3.2 - 1Bデコーダートランスフォーマーモデルの小型版です。単一のA100 40GB GPUを使用して23時間、アムハラ語の2億7400万トークンのテキストを用いてゼロから事前学習されています。

4億個のパラメータを持っています。
このモデルのコンテキストサイズは1024トークンです。
Llama - 3.2 - 1Bと同じトークナイザーを使用しており、モデルと同じアムハラ語データセットを用いてゼロから学習され、語彙サイズは32kです。
検証パープレキシティ：41.3
これはベースモデルであり、まだ教師あり微調整は行われていません。

🚀 クイックスタート

📦 インストール

まず、最新バージョンのtransformersをインストールする必要があります。

pip install -Uq transformers

💻 使用例

基本的な使用法

このモデルは、テキスト生成パイプラインで直接使用することができます。

from transformers import pipeline

llama_am = pipeline(
    "text-generation",
    model="rasyosef/Llama-3.2-400M-Amharic",
    device_map="auto"
  )

prompt = "አዲስ አበባ"
llama_am(
    prompt,
    max_new_tokens=128,
    temperature=0.5,
    do_sample=True,
    top_k=8,
    top_p=0.8,
    repetition_penalty=1.2
  )

出力:

[{'generated_text': 'አዲስ አበባ፣ ታህሳስ 8 ፣2012 (ኤፍ ቢ ሲ) የኢፌዴሪ የውጭ ጉዳይ ሚኒስትር አቶ ገዱ አንዳርጋቸው ከአፍሪካ ህብረት የስራ አስፈጻሚዎች ምክር ቤት መደበኛ ስብሰባ ጎን ለጎን ከዴሞክራቲክ ሪፐብሊክ ኮንጎ አቻቸው ማሪ ቱምባ ንዜዛ እና ከሌሎች የአፍሪካ አምባሳደሮች ጋር ተወያይተዋል።በውይይታቸውም በአፍሪካ የኮሮና ቫይረስን ለመከላከል እየተከናወኑ ባሉ ስራዎች ዙሪያ መምከራቸውን በትዊተር ገጻቸው አስፍረዋል።የሁለቱን ሀገራት ግንኙነት በተመለከተም፥ ኢትዮጵያ በህብረቱ ቋሚ አምባሳደርነት ባላት ሀላፊነት ለሹመት ማቅረብዋ የሚደነቅ መሆኑንም አንስተዋል።ኢትዮጵያ የኮቪድ19 ወረርሽኝን ለመግታት እያደረገች ባለው ጥረት ለደቡብ አፍሪካ ምስጋና አቅርባም ነበር፤ ቫይረሱን ለመቆጣጠር ከኢትዮጵያ ምን እንደምትማር በዝርዝር ላቀረብንላቸው ጥያቄም ወደፊት በሚሰሩ የትብብር መስኮች ላይ ተነጋግረን መስራት እንፈልጋለን ብለዋል።በቀጣይም ሁለቱ'}]