arxiv - summarization開源科研論文摘要生成模型

首頁

Arxiv Summarization

由Talina06開發

基於google/flan-t5-small微調的科研論文摘要生成模型，專為arXiv論文優化

文本生成

Safetensors

英語開源協議:Apache-2.0 #科研論文摘要 #arXiv優化 #T5微調

下載量 56

發布時間 : 3/12/2025

模型概述

該模型用於從長篇研究論文生成精簡摘要，特別適合科研論文的摘要生成任務

模型特點

科研論文優化

專門針對arXiv科研論文內容進行優化，能更好理解學術術語和論文結構

高效摘要生成

能夠從長篇研究論文中提取關鍵信息生成簡潔摘要

基於FLAN-T5

建立在google/flan-t5-small基礎上，具備良好的文本理解和生成能力

模型能力

科研論文摘要生成

學術文本理解

關鍵信息提取

使用案例

學術研究

論文摘要自動生成

為研究人員自動生成論文摘要，節省時間

生成簡潔準確的論文摘要

文獻綜述輔助

幫助快速理解大量論文內容

提高文獻閱讀效率

🚀 arxiv-summarization

本模型是基於數據集armanc/scientific_papers（arxiv）對google/flan-t5-small進行微調後的版本。它針對科學摘要的總結進行了優化。

🚀 快速開始

本模型可用於生成較長研究論文的簡短摘要。以下是使用示例：

from transformers import T5ForConditionalGeneration, T5Tokenizer

model = T5ForConditionalGeneration.from_pretrained("Talina06/arxiv-summarization")
tokenizer = T5Tokenizer.from_pretrained("Talina06/arxiv-summarization")

text = "Summarize: Deep learning is being used to advance medical research, particularly in cancer detection."
inputs = tokenizer(text, return_tensors="pt")
summary_ids = model.generate(**inputs)
summary = tokenizer.decode(summary_ids[0], skip_special_tokens=True)

print("Generated Summary:", summary)

✨ 主要特性

基於google/flan-t5-small模型進行微調。
以Arxiv研究論文作為訓練數據，專注於文本摘要生成。
可有效生成較長研究論文的簡短摘要。

📦 安裝指南

文檔未提及具體安裝步驟，可參考transformers庫的安裝方式，使用以下命令安裝：

pip install transformers

💻 使用示例

基礎用法

from transformers import T5ForConditionalGeneration, T5Tokenizer

model = T5ForConditionalGeneration.from_pretrained("Talina06/arxiv-summarization")
tokenizer = T5Tokenizer.from_pretrained("Talina06/arxiv-summarization")

text = "Summarize: Deep learning is being used to advance medical research, particularly in cancer detection."
inputs = tokenizer(text, return_tensors="pt")
summary_ids = model.generate(**inputs)
summary = tokenizer.decode(summary_ids[0], skip_special_tokens=True)

print("Generated Summary:", summary)

📚 詳細文檔

模型詳情

屬性	詳情
基礎模型	`google/flan-t5-small`
訓練數據	Arxiv研究論文（`article` → `abstract`）
微調任務	文本摘要
使用場景	生成較長研究論文的簡短摘要
許可證	Apache 2.0

訓練詳情

訓練數據：100k+ Arxiv研究論文
訓練框架：Hugging Face Transformers
超參數：
- 學習率：5e-5
- 批量大小：8
- 訓練輪數：10
使用的硬件：TPU & GPU

示例摘要

原始摘要	生成的摘要
"深度學習已經改變了許多領域... 我們提出了一種用於癌症檢測的新卷積神經網絡..."	"使用深度學習提出了一種用於癌症檢測的卷積神經網絡模型。"
"量子計算在密碼學應用方面顯示出了潛力..."	"量子計算可用於密碼學。"

🔧 技術細節

本模型是在google/flan-t5-small基礎上，使用Hugging Face Transformers框架，以Arxiv研究論文作為訓練數據進行微調。通過設置學習率為5e-5、批量大小為8、訓練輪數為10，在TPU和GPU硬件上進行訓練，最終得到優化後的模型，用於科學摘要的總結。