L

Llama 3.2 400M Amharic

由rasyosef開發
這是一個基於Meta公司Llama-3.2-1B模型的精簡版本,專門針對阿姆哈拉語進行預訓練,包含4億參數,上下文長度為1024個標記。
下載量 310
發布時間 : 11/26/2024

模型概述

該模型是一個解碼器變壓器模型,專門用於阿姆哈拉語的文本生成任務,未經過監督微調。

模型特點

阿姆哈拉語優化
使用2.74億個阿姆哈拉語文本標記進行預訓練,專門優化了阿姆哈拉語的文本生成能力。
精簡模型
基於Llama-3.2-1B模型的精簡版本,參數規模為4億,適合在單塊A100 40GB顯卡上運行。
高效訓練
在單塊A100 40GB顯卡上僅用23小時完成預訓練,驗證困惑度為41.3。

模型能力

阿姆哈拉語文本生成
長文本生成(1024標記上下文長度)

使用案例

文本生成
新聞摘要生成
根據阿姆哈拉語新聞標題生成新聞摘要
生成連貫且符合語境的新聞內容
對話系統
用於阿姆哈拉語聊天機器人的回覆生成
生成自然流暢的對話回覆
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase