P

Phi 3.5

由cortexso開發
Phi-3.5是由Microsoft開發的基於Phi-3架構的先進大語言模型,專注於高質量、富含推理的數據,支持128K標記上下文長度。
下載量 304
發布時間 : 10/29/2024

模型概述

Phi-3.5是一款指令調優語言模型,通過監督學習、近端策略優化(PPO)和直接偏好優化(DPO)進行微調,確保精確的指令遵循和強大的安全措施。

模型特點

高質量推理數據
專注於高質量、富含推理的數據,提升模型的推理能力。
128K標記上下文長度
支持長上下文理解和複雜推理任務。
多階段微調
通過監督學習、PPO和DPO進行微調,確保指令遵循和安全性。
高質量訓練數據
訓練數據包含合成數據集和經過精心篩選的公開網絡內容。

模型能力

文本生成
複雜推理
長上下文理解
指令遵循

使用案例

自然語言處理
複雜問答
處理需要長上下文理解和複雜推理的問答任務。
文本摘要
生成長文檔的簡潔摘要。
代碼生成
代碼補全
根據上下文生成代碼片段。
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase