SciPhi-Mistral-7B-32k开源大模型 - 免费部署助力科学推理与教育提升

首页

Sciphi Mistral 7B 32k

由 SciPhi 开发

基于Mistral-7B-v0.1微调的大型语言模型，专注于提升科学推理与教育能力

大型语言模型

Transformers

开源协议:MIT #科学推理增强 #长文本处理 #教育领域优化

下载量 143

发布时间 : 10/16/2023

模型简介

该模型经过超过10亿个标记的微调，包含常规指令调优数据和合成教科书，旨在增强科学推理和教育应用能力。建议遵循Alpaca提示指南以获得最佳效果。

模型特点

科学推理能力增强

通过超过10亿标记的微调，特别强化科学领域的推理能力

32k上下文长度

支持长上下文处理，适合复杂科学问题和教育场景

教育优化

使用合成教科书数据进行训练，特别适合教育应用

高效注意力机制

采用分组查询注意力和滑动窗口注意力，提高推理效率

模型能力

科学问题解答

教育内容生成

复杂推理任务处理

长文本理解与生成

多轮对话

使用案例

教育

科学教材生成

生成适合不同教育水平的科学教材内容

可生成结构清晰、内容准确的科学教育材料

学生答疑

回答学生在科学学习过程中的各种问题

提供准确、详细的科学解释

研究

科学文献分析

帮助研究人员理解和分析科学文献

可提取关键信息并生成摘要

🚀 SciPhi-Mistral-7B-32k模型卡片

SciPhi-Mistral-7B-32k是一个基于Mistral-7B-v0.1微调的大语言模型（LLM）。该模型使用超过10亿个标记进行了四个周期的微调，这些标记包括常规的指令调优数据和合成教科书。这项工作的目标是提高模型的科学推理和教育能力。为获得最佳效果，请遵循Alpaca提示指南。

SciPhi-AI可通过免费的托管API使用，不过暴露的模型可能会有所不同。目前，可使用SciPhi-Self-RAG-Mistral-7B-32k。更多详细信息可在文档中找到。

✨ 主要特性

模型架构：基于Mistral-7B-v0.1，具有Transformer架构、分组查询注意力、滑动窗口注意力和字节回退BPE分词器等特性。
微调优化：使用超过10亿个标记进行四个周期的微调，提升科学推理和教育能力。
API支持：可通过免费的托管API使用。

📦 安装指南

文档未提及安装步骤，跳过该章节。

💻 使用示例

基础用法

# 推荐的聊天格式示例
messages = [
    {
        "role": "system",
        "content": "You are a friendly chatbot who always responds in the style of a pirate",
    },
    {"role": "user", "content": "How many helicopters can a human eat in one sitting?"},
]

# 转换为以下格式
# 系统提示
print("### System:")
print("You are a friendly chatbot who always responds in the style of a pirate")
# 指令
print("### Instruction:")
print("How many helicopters can a human eat in one sitting?")
# 响应
print("### Response:")
print("...")

📚 详细文档

模型架构

属性	详情
基础模型	Mistral-7B-v0.1
架构特性	基于Transformer的模型、分组查询注意力、滑动窗口注意力、字节回退BPE分词器

参考文献

Lian, W., Goodson, B., Wang, G., Pentland, E., Cook, A., Vong, C., & Teknium. (2023). MistralOrca: Mistral-7B Model Instruct-tuned on Filtered OpenOrcaV1 GPT-4 Dataset. HuggingFace repository. 链接
Mukherjee, S., Mitra, A., Jawahar, G., Agarwal, S., Palangi, H., & Awadallah, A. (2023). Orca: Progressive Learning from Complex Explanation Traces of GPT-4. arXiv预印本 arXiv:2306.02707.
Longpre, S., Hou, L., Vu, T., Webson, A., Chung, H. W., Tay, Y., Zhou, D., Le, Q. V., Zoph, B., Wei, J., & Roberts, A. (2023). The Flan Collection: Designing Data and Methods for Effective Instruction Tuning. arXiv预印本 arXiv:2301.13688.
Mistral AI. (2023). Model Card for Mistral-7B-v0.1. The Mistral-7B-v0.1 Large Language Model (LLM) is a pretrained generative text model with 7 billion parameters. Mistral-7B-v0.1 outperforms Llama 2 13B on all benchmarks tested. For full details, please refer to the paper and release blog post. Model Architecture: Transformer with Grouped-Query Attention, Sliding-Window Attention, and Byte-fallback BPE tokenizer. 链接