🚀 緬甸GPT
緬甸GPT是一個能夠理解緬甸語的模型。它基於GPT架構,旨在讓緬甸語在GPT2模型中得以應用。該模型使用了由MinSiThu創建的私有緬甸語數據集進行訓練。
🚀 快速開始
Myanmar GPT是一個基於私有緬甸語數據集訓練的模型,由MinSiThu製作。該項目旨在使緬甸語能夠在GPT2模型中使用。
對MyanmarGPT模型進行微調,比使用其他語言模型更容易構建自定義的緬甸語模型。
MyanmarGPT模型的訓練報告可視化展示在 MyanmarGPT報告。
支持緬甸語的模型變體可以在 https://github.com/MinSiThu/MyanmarGPT 找到。
還有一個支持多語言、擁有14.2億參數的MyanmarGPT - Big模型。你可以在 這裡 找到它。
目前,緬甸GPT有四個主要的變體版本:
📦 安裝指南
!pip install transformers
💻 使用示例
基礎用法
from transformers import pipeline
generator = pipeline(model="jojo-ai-mst/MyanmarGPT")
outputs = generator("အီတလီ",do_sample=False)
print(outputs)
高級用法
import torch
from transformers import GPT2Tokenizer, GPT2LMHeadModel
model = GPT2LMHeadModel.from_pretrained("jojo-ai-mst/MyanmarGPT")
tokenizer = GPT2Tokenizer.from_pretrained("jojo-ai-mst/MyanmarGPT")
def generate_text(prompt, max_length=300, temperature=0.8, top_k=50):
input_ids = tokenizer.encode(prompt, return_tensors="pt").cuda()
output = model.generate(
input_ids,
max_length=max_length,
temperature=temperature,
top_k=top_k,
pad_token_id=tokenizer.eos_token_id,
do_sample=True
)
for result in output:
generated_text = tokenizer.decode(result, skip_special_tokens=True)
print(generated_text)
generate_text("အီတလီ ")
📚 詳細文檔
緬甸語與人工智能路線圖
我發起了MyanmarGPT項目,它對緬甸產生了巨大影響。因此,我將這個項目以 [MyanmarGPT運動](https://github.com/MyanmarGPT - Movement) 的形式繼續推進。MyanmarGPT運動旨在讓每個人都能在緬甸發起人工智能項目。
📄 許可證
以下是使用MyanmarGPT許可證的指南:
- 任何人都可以免費使用MyanmarGPT。
- 必須做到:
- 任何從MyanmarGPT派生/微調、在內部使用MyanmarGPT或對MyanmarGPT進行修改且與MyanmarGPT相關的項目,必須在相應項目頁面提及以下引用內容。
- 引用內容
@software{MyanmarGPT,
author = {{MinSiThu}},
title = {MyanmarGPT},
version={1.1-SweptWood}
url = {https://huggingface.co/jojo-ai-mst/MyanmarGPT},
urldate = {2023-12-14}
date = {2023-12-14},
}
如需聯繫我,請通過 [https://www.linkedin.com/in/min - si - thu/](https://www.linkedin.com/in/min - si - thu/) 與我取得聯繫。