S

Smollm3 3B

由HuggingFaceTB開發
SmolLM3是一款參數為30億的語言模型,旨在突破小模型的性能邊界。它支持6種語言,具備高級推理能力和長上下文處理能力,是一個完全開源的模型。
下載量 1,138
發布時間 : 7/8/2025

模型概述

SmolLM3是一個30億參數的語言模型,支持6種語言,具備高級推理能力和長上下文處理能力,適用於多種自然語言處理任務。

模型特點

高級推理能力
支持擴展思考模式,提升複雜推理任務的性能。
長上下文處理
支持64k上下文訓練,並可擴展至128k標記。
多語言支持
原生支持6種語言(英語、法語、西班牙語、德語、意大利語和葡萄牙語)。
工具調用
支持通過XML或Python代碼片段調用外部工具。
完全開源
開放權重和完整的訓練細節,包括數據混合和訓練配置。

模型能力

文本生成
高級推理
長上下文處理
多語言支持
工具調用

使用案例

教育
數學問題解答
解答高中數學競賽題目,如AIME 2025。
在AIME 2025評估中得分36.7(擴展思考模式)。
編程
代碼生成
生成競賽編程代碼。
在LiveCodeBench v4評估中得分30.0(擴展思考模式)。
多語言應用
多語言問答
支持多種語言的問答任務。
在Global MMLU評估中得分64.1(擴展思考模式)。
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase