B

BPO

由THUDM開發
BPO是一種無需訓練大語言模型的黑盒對齊技術,通過優化用戶輸入提示來改進模型輸出質量。
下載量 155
發布時間 : 11/20/2023

模型概述

BPO是一種區別於傳統訓練方法的黑盒對齊技術,僅需訓練即插即用模型來優化用戶輸入,適用於各類開源或基於API的大語言模型。

模型特點

無需模型訓練
僅通過優化用戶輸入提示即可改進大語言模型輸出,無需對基礎模型進行訓練
廣泛適用性
可應用於各類開源或基於API的大語言模型,包括GPT-3.5、Claude-2等
性能提升顯著
實驗顯示在多個模型上能顯著提高輸出質量,勝率普遍超過50%

模型能力

提示優化
大語言模型對齊
文本生成改進

使用案例

大語言模型應用
GPT-3.5輸出優化
使用BPO優化GPT-3.5的輸入提示,獲得更優質的輸出
相比原始GPT-3.5,優化後勝率達60%
Claude-2輸出改進
通過BPO優化Claude-2的輸入提示
優化後勝率達57.5%
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase