S

SOLAR 10.7B V1.0

由upstage開發
SOLAR-10.7B是一個擁有107億參數的大語言模型,通過深度向上擴展技術實現卓越性能,在300億參數以下模型中表現頂尖。
下載量 7,480
發布時間 : 12/12/2023

模型概述

SOLAR-10.7B是一個先進的大語言模型,採用深度向上擴展(DUS)方法構建,在各類自然語言處理任務中展現出卓越性能。雖然結構緊湊,但其性能超越許多更大規模的模型。

模型特點

深度向上擴展技術
採用創新的DUS方法擴展模型規模,融合架構改進與持續預訓練策略,實現高效擴展
卓越性能
在300億參數以下模型中表現頂尖,甚至超越最新發布的Mixtral 8X7B模型
高效微調
為微調任務提供強大的魯棒性和適應性,簡單指令微調即可帶來顯著性能提升

模型能力

文本生成
自然語言理解
指令跟隨

使用案例

自然語言處理
文本補全
根據給定文本提示生成連貫的後續內容
生成流暢、符合語境的文本
對話系統
作為基礎模型用於構建對話AI系統
需進行額外微調以獲得最佳對話效果
研究應用
模型壓縮研究
研究如何在較小模型規模下實現高性能
為高效模型架構設計提供參考
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase