🚀 トランスフォーマーライブラリによる要約モデル
このプロジェクトは、トランスフォーマーライブラリを使用して、ベトナム語の文章を要約するためのものです。具体的には、CreatorPhan/ViSummary
モデルを活用して、文章の要約を行います。
🚀 クイックスタート
以下のコードを使って、要約モデルを簡単に使い始めることができます。
基本的な使用法
from transformers import AutoTokenizer, T5ForConditionalGeneration
device = 'cpu'
model_path = "CreatorPhan/ViSummary"
model = T5ForConditionalGeneration.from_pretrained(model_path).to(device)
tokenizer = AutoTokenizer.from_pretrained(model_path)
context = """
Một yếu tố quan trọng khiến thương vụ Messi trở lại Barca có cơ hội lớn thành công là việc La Liga đã phê chuẩn kế hoạch cân bằng tài chính do Barca trình bày trong buổi họp gần đây. Điều này giúp đội bóng xứ Catalonia giải quyết vấn đề khúc mắc lớn nhất. Vào mùa hè năm 2021, Messi phải rời Barca sau 21 năm gắn bó do CLB không thể đáp ứng quy định tài chính của La Liga.
Messi trở thành cầu thủ tự do sau khi hết hai năm hợp đồng với PSG. Anh được nhiều CLB mời chào. Theo Athletic, có ba đội đang nhắm tới anh là Barca, Inter Miami (Mỹ) và một CLB Arab Saudi. Trong đó, chỉ có phía Saudi đưa ra đề nghị chính thức cho Messi, với hợp đồng trị giá 400 triệu USD mỗi năm.
Tuy nhiên, ở tuổi 35, Messi vẫn muốn trở lại Barca để cống hiến cho CLB đã làm nên tên tuổi của anh. Lúc này, đội chủ sân Nou Camp được dẫn dắt bởi HLV Xavi - đồng đội và là đàn anh chỉ dạy Messi trong những năm đầu sự nghiệp.
"""
tokens = tokenizer(f"Tóm tắt văn bản sau: {context}", return_tensors='pt').input_ids
output = model.generate(tokens.to(device), max_new_tokens=170)[0]
predict = tokenizer.decode(output, skip_special_tokens=True)
print(len(predict.split()))
print(predict)
📦 インストール
このコードを実行するには、transformers
ライブラリが必要です。以下のコマンドでインストールできます。
pip install transformers
📚 ドキュメント
- モデル:
CreatorPhan/ViSummary
は、ベトナム語の文章を要約するために訓練されたモデルです。
- トークナイザー:
AutoTokenizer
を使用して、入力テキストをトークン化します。
- 要約の生成:
T5ForConditionalGeneration
モデルを使用して、要約を生成します。
🔧 技術詳細
このモデルは、T5ForConditionalGeneration
アーキテクチャを使用しており、ベトナム語の文章要約に特化して訓練されています。トークナイザーは、入力テキストをトークンに分割し、モデルはこれらのトークンを使用して要約を生成します。
📄 ライセンス
このプロジェクトのライセンス情報は、元のモデルリポジトリに記載されているものに準拠します。具体的なライセンスの詳細については、CreatorPhan/ViSummary
のリポジトリを参照してください。