P

Pal B Large Opt 350m

由daiweichen開發
該模型是一個用於多元化對齊的個性化獎勵模型,基於facebook/opt-350m訓練,用於文本摘要任務。
下載量 37
發布時間 : 2/28/2025

模型概述

PAL-B-Large-opt-350m是一個多元化對齊的個性化獎勵模型,專注於處理人類偏好的多樣性。它採用模塊化設計,能夠高效地對新用戶的偏好進行少樣本定位,適用於文本摘要等任務。

模型特點

多元化對齊
模型能夠處理多樣化的用戶偏好,而不僅僅是假設所有用戶共享同質偏好。
模塊化設計
利用用戶間的共性同時滿足個體個性化需求,能夠高效地對新用戶的偏好進行少樣本定位。
高效性能
在Reddit TL;DR摘要任務中,對已知用戶的準確率比之前最佳方法高1.7%,對未知用戶高36%,且參數數量少100倍。

模型能力

文本摘要
個性化獎勵建模
少樣本學習

使用案例

文本處理
Reddit TL;DR摘要
為Reddit帖子生成簡潔的摘要,同時考慮不同用戶的偏好。
對已知用戶的準確率比之前最佳方法高1.7%,對未知用戶高36%。
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase