🚀 keyT5. Base (small) 版本
keyT5. Base (small) 版本是一款用于文本提取关键词的模型,它能够高效地从文本中提取关键信息,为信息处理和分析提供有力支持。
🚀 快速开始
安装依赖
pip install transformers sentencepiece
使用示例
from itertools import groupby
import torch
from transformers import T5ForConditionalGeneration, T5Tokenizer
model_name = "0x7194633/keyt5-large"
tokenizer = T5Tokenizer.from_pretrained(model_name)
model = T5ForConditionalGeneration.from_pretrained(model_name)
def generate(text, **kwargs):
inputs = tokenizer(text, return_tensors='pt')
with torch.no_grad():
hypotheses = model.generate(**inputs, num_beams=5, **kwargs)
s = tokenizer.decode(hypotheses[0], skip_special_tokens=True)
s = s.replace('; ', ';').replace(' ;', ';').lower().split(';')[:-1]
s = [el for el, _ in groupby(s)]
return s
article = """Reuters сообщил об отмене 3,6 тыс. авиарейсов из-за «омикрона» и погоды
Наибольшее число отмен авиарейсов 2 января пришлось на американские авиакомпании
SkyWest и Southwest, у каждой — более 400 отмененных рейсов. При этом среди
отмененных 2 января авиарейсов — более 2,1 тыс. рейсов в США. Также свыше 6400
рейсов были задержаны."""
print(generate(article, top_p=1.0, max_length=64))
训练模型
你可以通过以下链接访问训练笔记本,了解更多训练相关信息:

✨ 主要特性
- 多语言支持:支持俄语等语言的关键词提取。
- 灵活配置:可以通过调整参数(如
top_p
等)来优化关键词提取效果。
📦 安装指南
使用以下命令安装必要的依赖库:
pip install transformers sentencepiece
📚 详细文档
📄 许可证
本项目采用 MIT 许可证。
项目状态

推理参数
示例
示例标题 |
文本内容 |
冠状病毒 |
在俄罗斯可能会出现新冠病毒“奥密克戎”的新毒株,这可能导致 1 月份发病率上升,俄罗斯人民友谊大学传染病学系副教授谢尔盖·沃兹涅先斯基表示。他指出,“德尔塔”变种导致的死亡病例比“奥密克戎”更多,正是在“德尔塔”的背景下死亡率达到了最高值。 |
英国 |
据英国媒体报道,英国国防参谋部参谋长托尼·拉达金上将在参观重型武器库时被要求假装忙碌。命令中说,军人被要求跑到汽车旁,打开所有舱口、舱门,翻阅操作手册,检查车辆,就好像在进行功能测试以确保设备正常运行一样。 |
技术 |
要播放音乐,只需按下键盘上的按钮。每个键对应一个特定的样本 —— 有沙锤声和类似激光枪射击的未来主义音效。从所有这些多样的声音中可以形成自己的模式,并观察带有动画几何图形的可视化效果。有趣的是,按下空格键可以完全改变屏幕上的外观、颜色和样本的声音。 |