🚀 keyT5. Base (small) 版本
keyT5. Base (small) 版本是一款用於文本提取關鍵詞的模型,它能夠高效地從文本中提取關鍵信息,為信息處理和分析提供有力支持。
🚀 快速開始
安裝依賴
pip install transformers sentencepiece
使用示例
from itertools import groupby
import torch
from transformers import T5ForConditionalGeneration, T5Tokenizer
model_name = "0x7194633/keyt5-large"
tokenizer = T5Tokenizer.from_pretrained(model_name)
model = T5ForConditionalGeneration.from_pretrained(model_name)
def generate(text, **kwargs):
inputs = tokenizer(text, return_tensors='pt')
with torch.no_grad():
hypotheses = model.generate(**inputs, num_beams=5, **kwargs)
s = tokenizer.decode(hypotheses[0], skip_special_tokens=True)
s = s.replace('; ', ';').replace(' ;', ';').lower().split(';')[:-1]
s = [el for el, _ in groupby(s)]
return s
article = """Reuters сообщил об отмене 3,6 тыс. авиарейсов из-за «омикрона» и погоды
Наибольшее число отмен авиарейсов 2 января пришлось на американские авиакомпании
SkyWest и Southwest, у каждой — более 400 отмененных рейсов. При этом среди
отмененных 2 января авиарейсов — более 2,1 тыс. рейсов в США. Также свыше 6400
рейсов были задержаны."""
print(generate(article, top_p=1.0, max_length=64))
訓練模型
你可以通過以下鏈接訪問訓練筆記本,瞭解更多訓練相關信息:

✨ 主要特性
- 多語言支持:支持俄語等語言的關鍵詞提取。
- 靈活配置:可以通過調整參數(如
top_p
等)來優化關鍵詞提取效果。
📦 安裝指南
使用以下命令安裝必要的依賴庫:
pip install transformers sentencepiece
📚 詳細文檔
📄 許可證
本項目採用 MIT 許可證。
項目狀態

推理參數
示例
示例標題 |
文本內容 |
冠狀病毒 |
在俄羅斯可能會出現新冠病毒“奧密克戎”的新毒株,這可能導致 1 月份發病率上升,俄羅斯人民友誼大學傳染病學系副教授謝爾蓋·沃茲涅先斯基表示。他指出,“德爾塔”變種導致的死亡病例比“奧密克戎”更多,正是在“德爾塔”的背景下死亡率達到了最高值。 |
英國 |
據英國媒體報道,英國國防參謀部參謀長託尼·拉達金上將在參觀重型武器庫時被要求假裝忙碌。命令中說,軍人被要求跑到汽車旁,打開所有艙口、艙門,翻閱操作手冊,檢查車輛,就好像在進行功能測試以確保設備正常運行一樣。 |
技術 |
要播放音樂,只需按下鍵盤上的按鈕。每個鍵對應一個特定的樣本 —— 有沙錘聲和類似激光槍射擊的未來主義音效。從所有這些多樣的聲音中可以形成自己的模式,並觀察帶有動畫幾何圖形的可視化效果。有趣的是,按下空格鍵可以完全改變屏幕上的外觀、顏色和樣本的聲音。 |