🚀 FLAN - T5數學問答模型
這是一個基於Transformer架構的語言模型,專門針對數學問答場景在特定數據集上進行訓練。它能處理英文的數學相關問題,但目前僅用於研究,輸出可靠性較低,不建議用於生產環境。
🚀 快速開始
此模型僅用於研究目的,請勿在生產環境中使用,其輸出結果極不可靠。
✨ 主要特性
💻 使用示例
基礎用法
以下是在transformers
庫中使用該模型的示例腳本:
使用PyTorch模型
在CPU上運行模型
from transformers import T5Tokenizer, T5ForConditionalGeneration
tokenizer = T5Tokenizer.from_pretrained("ArtifactAI/flan-t5-base-arxiv-math-question-answering")
model = T5ForConditionalGeneration.from_pretrained("ArtifactAI/flan-t5-base-arxiv-math-question-answering")
input_text = "What is the spectral isolation of bi-invariant metrics?"
input_ids = tokenizer(input_text, return_tensors="pt").input_ids
outputs = model.generate(input_ids)
print(tokenizer.decode(outputs[0]))
在GPU上運行模型
from transformers import T5Tokenizer, T5ForConditionalGeneration
tokenizer = T5Tokenizer.from_pretrained("ArtifactAI/flan-t5-base-arxiv-math-question-answering")
model = T5ForConditionalGeneration.from_pretrained("ArtifactAI/flan-t5-base-arxiv-math-question-answering", device_map="auto")
input_text = "What is the spectral isolation of bi-invariant metrics?"
input_ids = tokenizer(input_text, return_tensors="pt").input_ids.to("cuda")
outputs = model.generate(input_ids)
print(tokenizer.decode(outputs[0]))
在HF管道中運行模型
FP16
qa = pipeline("summarization", model="ArtifactAI/flan-t5-base-arxiv-math-question-answering")
query = "What is the spectral isolation of bi-invariant metrics?"
print(f"query: {query}")
res = qa("answer: " + query)
print(f"{res[0]['summary_text']}")
🔧 技術細節
訓練數據
該模型在ArtifactAI/arxiv - math - instruct - 50k數據集上進行訓練,這是一個問答對數據集。問題使用t5 - base模型生成,答案使用GPT - 3.5 - turbo模型生成。
📄 許可證
本模型採用Apache 2.0許可證。
📚 引用
@misc{flan-t5-base-arxiv-math-question-answering,
title={flan-t5-base-arxiv-math-question-answering},
author={Matthew Kenney},
year={2023}
}