M

Mistral Supra

Developed by TRI-ML
Mistral-SUPRA是基於Mistral-7B初始化的線性RNN模型,兼具Transformer和循環模型的功能。
Downloads 163
Release Time : 4/9/2024

Model Overview

該模型通過特定訓練過程將Mistral-7B轉化為線性RNN,支持在推理時選擇並行或循環模式,適用於文本生成任務。

Model Features

線性RNN架構
將Mistral-7B轉化為線性RNN,兼具Transformer和循環模型的功能
雙模式推理
支持並行和循環兩種推理模式,可根據需求選擇
高效訓練
在100B標記的數據集上僅需1.5天完成訓練

Model Capabilities

文本生成
語言理解

Use Cases

自然語言處理
文本補全
根據給定文本片段生成連貫的後續內容
示例輸出:'Machine learning is a branch of artificial intelligence (AI) that enables computers to learn from experience...'
AIbase
Empowering the Future, Your AI Solution Knowledge Base
© 2025AIbase