🚀 缅甸GPT
缅甸GPT是一个能够理解缅甸语的模型。它基于GPT架构,旨在让缅甸语在GPT2模型中得以应用。该模型使用了由MinSiThu创建的私有缅甸语数据集进行训练。
🚀 快速开始
Myanmar GPT是一个基于私有缅甸语数据集训练的模型,由MinSiThu制作。该项目旨在使缅甸语能够在GPT2模型中使用。
对MyanmarGPT模型进行微调,比使用其他语言模型更容易构建自定义的缅甸语模型。
MyanmarGPT模型的训练报告可视化展示在 MyanmarGPT报告。
支持缅甸语的模型变体可以在 https://github.com/MinSiThu/MyanmarGPT 找到。
还有一个支持多语言、拥有14.2亿参数的MyanmarGPT - Big模型。你可以在 这里 找到它。
目前,缅甸GPT有四个主要的变体版本:
📦 安装指南
!pip install transformers
💻 使用示例
基础用法
from transformers import pipeline
generator = pipeline(model="jojo-ai-mst/MyanmarGPT")
outputs = generator("အီတလီ",do_sample=False)
print(outputs)
高级用法
import torch
from transformers import GPT2Tokenizer, GPT2LMHeadModel
model = GPT2LMHeadModel.from_pretrained("jojo-ai-mst/MyanmarGPT")
tokenizer = GPT2Tokenizer.from_pretrained("jojo-ai-mst/MyanmarGPT")
def generate_text(prompt, max_length=300, temperature=0.8, top_k=50):
input_ids = tokenizer.encode(prompt, return_tensors="pt").cuda()
output = model.generate(
input_ids,
max_length=max_length,
temperature=temperature,
top_k=top_k,
pad_token_id=tokenizer.eos_token_id,
do_sample=True
)
for result in output:
generated_text = tokenizer.decode(result, skip_special_tokens=True)
print(generated_text)
generate_text("အီတလီ ")
📚 详细文档
缅甸语与人工智能路线图
我发起了MyanmarGPT项目,它对缅甸产生了巨大影响。因此,我将这个项目以 [MyanmarGPT运动](https://github.com/MyanmarGPT - Movement) 的形式继续推进。MyanmarGPT运动旨在让每个人都能在缅甸发起人工智能项目。
📄 许可证
以下是使用MyanmarGPT许可证的指南:
- 任何人都可以免费使用MyanmarGPT。
- 必须做到:
- 任何从MyanmarGPT派生/微调、在内部使用MyanmarGPT或对MyanmarGPT进行修改且与MyanmarGPT相关的项目,必须在相应项目页面提及以下引用内容。
- 引用内容
@software{MyanmarGPT,
author = {{MinSiThu}},
title = {MyanmarGPT},
version={1.1-SweptWood}
url = {https://huggingface.co/jojo-ai-mst/MyanmarGPT},
urldate = {2023-12-14}
date = {2023-12-14},
}
如需联系我,请通过 [https://www.linkedin.com/in/min - si - thu/](https://www.linkedin.com/in/min - si - thu/) 与我取得联系。