flan-t5-titlegen-springer開源模型 - 免費將科學摘要精煉成簡潔標題

首頁

Flan T5 Titlegen Springer

由tiam4tt開發

基於google/flan-t5-base微調的模型，專門用於將科學摘要精煉為簡潔標題的抽象摘要生成任務。

文本生成

Transformers

英語開源協議:MIT #科學摘要標題生成 #機器學習領域專用 #高ROUGE分數

下載量 236

發布時間 : 3/31/2025

模型概述

該模型利用FLAN-T5的指令遵循能力，能夠生成精確且上下文相關的標題，特別適用於機器學習領域的研究摘要。

模型特點

專注於科學摘要標題生成

專門針對科學摘要進行優化，能夠生成精確且上下文相關的標題。

基於FLAN-T5的指令遵循能力

利用FLAN-T5的指令遵循能力，確保生成的標題符合用戶需求。

高性能指標

在ROUGE和F1分數等指標上表現優異，顯示出強大的摘要生成能力。

模型能力

文本摘要生成

科學文獻標題生成

指令遵循

使用案例

學術研究

機器學習論文標題生成

將機器學習領域的論文摘要自動生成為簡潔標題。

在Springer期刊數據上表現優異，ROUGE-1得分達到0.6852。

🚀 flan - t5 - titlegen - springer模型

本模型是一個用於科學摘要自動生成簡潔標題的模型，基於google/flan - t5 - base微調而來，能有效利用預訓練模型的能力，為機器學習相關研究生成精準標題。

🚀 快速開始

安裝依賴

確保你已經安裝了transformers庫，可以使用以下命令進行安裝：

pip install transformers

代碼示例

from transformers import AutoModelForSeq2SeqLM, AutoTokenizer

model = AutoModelForSeq2SeqLM.from_pretrained("tiam4tt/flan-t5-titlegen-springer")
tokenizer = AutoTokenizer.from_pretrained("tiam4tt/flan-t5-titlegen-springer")

abstract = "Transfer learning has become a crucial technique in deep learning, enabling models to leverage knowledge from pre-trained networks for improved performance on new tasks. In this study, we propose an optimized fine-tuning strategy for convolutional neural networks (CNNs), reducing training time while maintaining high accuracy. Experiments on CIFAR-10 show a 15% improvement in efficiency compared to standard fine-tuning methods, demonstrating the effectiveness of our approach."

inputs = tokenizer(abstract, return_tensors="pt", padding=True, truncation=True)
outputs = model.generate(**inputs, max_new_tokens=32)

title = tokenizer.decode(outputs[0], skip_special_tokens=True)
print(title)

✨ 主要特性

基於google/flan - t5 - base微調，專門用於將科學摘要進行抽象式總結，生成簡潔標題。
在來自Springer期刊出版物的數據集上進行訓練，該數據集經過篩選，僅包含與機器學習相關的研究。
利用FLAN - T5的指令跟隨能力，生成精確且與上下文相關的標題。

📚 詳細文檔

模型詳情

開發者：tiam4tt，HTThuanHcmus
模型類型：語言模型
語言（NLP）：英語
許可證：MIT
微調基礎模型：[google/flan - t5 - base](https://huggingface.co/google/flan - t5 - base)