🚀 FLAN - T5数学问答模型
这是一个基于Transformer架构的语言模型,专门针对数学问答场景在特定数据集上进行训练。它能处理英文的数学相关问题,但目前仅用于研究,输出可靠性较低,不建议用于生产环境。
🚀 快速开始
此模型仅用于研究目的,请勿在生产环境中使用,其输出结果极不可靠。
✨ 主要特性
💻 使用示例
基础用法
以下是在transformers
库中使用该模型的示例脚本:
使用PyTorch模型
在CPU上运行模型
from transformers import T5Tokenizer, T5ForConditionalGeneration
tokenizer = T5Tokenizer.from_pretrained("ArtifactAI/flan-t5-base-arxiv-math-question-answering")
model = T5ForConditionalGeneration.from_pretrained("ArtifactAI/flan-t5-base-arxiv-math-question-answering")
input_text = "What is the spectral isolation of bi-invariant metrics?"
input_ids = tokenizer(input_text, return_tensors="pt").input_ids
outputs = model.generate(input_ids)
print(tokenizer.decode(outputs[0]))
在GPU上运行模型
from transformers import T5Tokenizer, T5ForConditionalGeneration
tokenizer = T5Tokenizer.from_pretrained("ArtifactAI/flan-t5-base-arxiv-math-question-answering")
model = T5ForConditionalGeneration.from_pretrained("ArtifactAI/flan-t5-base-arxiv-math-question-answering", device_map="auto")
input_text = "What is the spectral isolation of bi-invariant metrics?"
input_ids = tokenizer(input_text, return_tensors="pt").input_ids.to("cuda")
outputs = model.generate(input_ids)
print(tokenizer.decode(outputs[0]))
在HF管道中运行模型
FP16
qa = pipeline("summarization", model="ArtifactAI/flan-t5-base-arxiv-math-question-answering")
query = "What is the spectral isolation of bi-invariant metrics?"
print(f"query: {query}")
res = qa("answer: " + query)
print(f"{res[0]['summary_text']}")
🔧 技术细节
训练数据
该模型在ArtifactAI/arxiv - math - instruct - 50k数据集上进行训练,这是一个问答对数据集。问题使用t5 - base模型生成,答案使用GPT - 3.5 - turbo模型生成。
📄 许可证
本模型采用Apache 2.0许可证。
📚 引用
@misc{flan-t5-base-arxiv-math-question-answering,
title={flan-t5-base-arxiv-math-question-answering},
author={Matthew Kenney},
year={2023}
}