M

Mistral Supra

由TRI-ML開發
Mistral-SUPRA是基於Mistral-7B初始化的線性RNN模型,兼具Transformer和循環模型的功能。
下載量 163
發布時間 : 4/9/2024

模型概述

該模型通過特定訓練過程將Mistral-7B轉化為線性RNN,支持在推理時選擇並行或循環模式,適用於文本生成任務。

模型特點

線性RNN架構
將Mistral-7B轉化為線性RNN,兼具Transformer和循環模型的功能
雙模式推理
支持並行和循環兩種推理模式,可根據需求選擇
高效訓練
在100B標記的數據集上僅需1.5天完成訓練

模型能力

文本生成
語言理解

使用案例

自然語言處理
文本補全
根據給定文本片段生成連貫的後續內容
示例輸出:'Machine learning is a branch of artificial intelligence (AI) that enables computers to learn from experience...'
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase