🚀 模型ID的模型卡片
本模型用于从段落自动生成标题,能够将长摘要文本期刊总结为单行文本,这些单行文本可用作期刊的标题。
🚀 快速开始
使用以下代码开始使用该模型:
from transformers import pipeline
text = """Text that needs to be summarized"""
summarizer = pipeline("summarization", model="path-to-model")
summary = summarizer(text)[0]["summary_text"]
print (summary)
✨ 主要特性
- 作为文本摘要器创建标题。
- 作为可调整的语言模型用于下游任务。
📦 安装指南
文档未提及安装步骤,故跳过此部分。
💻 使用示例
基础用法
from transformers import pipeline
text = """Text that needs to be summarized"""
summarizer = pipeline("summarization", model="path-to-model")
summary = summarizer(text)[0]["summary_text"]
print (summary)
📚 详细文档
模型详情
模型描述
这是一个文本生成模型,用于将长摘要文本期刊总结为单行文本,这些单行文本可用作期刊的标题。
- 开发者:Tushar Joshi
- 共享者(可选):Tushar Joshi
- 模型类型:t5-small
- 语言(NLP):英语
- 许可证:Apache 2.0
- 微调基础模型(可选):t5-small基线
模型来源(可选)
- 仓库:https://huggingface.co/t5-small
用途
直接使用
作为段落的文本摘要器。
超出适用范围的使用
不应作为非常长段落的文本摘要器。
偏差、风险和局限性
- 最大输入令牌大小为1024。
- 最大输出令牌大小为24。
建议
用户(直接用户和下游用户)应了解模型的风险、偏差和局限性。如需进一步建议,还需更多信息。
训练详情
训练数据
训练数据是内部整理的,无法公开。
训练过程
无。
预处理(可选)
无。
训练超参数
速度、大小、时间(可选)
训练使用GPU T4x 2完成。该任务耗时4:09:47。使用了包含10,000个示例的数据集来训练生成模型。
评估
摘要质量在过去20年创建的5000篇研究期刊上进行了测试。
测试数据、因素和指标
- 测试数据大小:5000个示例
- 测试数据:测试数据是内部生成和整理的。
- 因素:[需要更多信息]
- 指标:模型使用Rouge指标进行评估,以下是达到的基线结果。
结果
轮次 |
训练损失 |
验证损失 |
Rouge1 |
Rouge2 |
Rougel |
Rougelsum |
生成长度 |
18 |
2.442800 |
2.375408 |
0.313700 |
0.134600 |
0.285400 |
0.285400 |
16.414100 |
19 |
2.454800 |
2.372553 |
0.312900 |
0.134100 |
0.284900 |
0.285000 |
16.445100 |
20 |
2.438900 |
2.372551 |
0.312300 |
0.134000 |
0.284500 |
0.284600 |
16.435500 |
环境影响
可以使用Lacoste等人(2019)中提出的机器学习影响计算器来估算碳排放。
- 硬件类型:GPU T4 x 2
- 使用时长:4.5小时
- 云服务提供商:GCP
- 计算区域:爱尔兰
- 碳排放:未知
技术规格(可选)
模型架构和目标
[需要更多信息]
计算基础设施
[需要更多信息]
硬件
[需要更多信息]
软件
[需要更多信息]
引用(可选)
BibTeX
[需要更多信息]
APA
[需要更多信息]
术语表(可选)
[需要更多信息]
更多信息(可选)
[需要更多信息]
模型卡片作者(可选)
Tushar Joshi
模型卡片联系人
Tushar Joshi
领英 - https://www.linkedin.com/in/tushar-joshi-816133100/
信息表格
属性 |
详情 |
模型类型 |
t5-small |
训练数据 |
训练数据是内部整理的,无法公开。 |
许可证 |
Apache 2.0 |
常用提示信息
⚠️ 重要提示
用户(直接用户和下游用户)应了解模型的风险、偏差和局限性。如需进一步建议,还需更多信息。
💡 使用建议
不应将该模型作为非常长段落的文本摘要器。