Gemma 2 2b Crosscoder L13 Mu4.1e 02 Lr1e 04
G

Gemma 2 2b Crosscoder L13 Mu4.1e 02 Lr1e 04

由science-of-finetuning開發
基於Gemma 2 2B和Gemma 2 2B IT模型第13層並行激活訓練的交叉編碼器
下載量 51
發布時間 : 11/22/2024

模型概述

該交叉編碼器是在fineweb和lsmsy-chat-1m數據集的子集上訓練而成,主要用於特徵提取任務。

模型特點

並行激活訓練
基於Gemma 2 2B和Gemma 2 2B IT模型的第13層並行激活訓練
高效特徵提取
專注於從模型中間層提取有意義的特徵表示
稀疏特徵學習
支持L1和L0稀疏度指標,可生成稀疏特徵表示

模型能力

模型中間層特徵提取
交叉模型特徵融合
稀疏特徵生成

使用案例

模型分析
模型內部表示研究
分析不同模型在相同輸入下的內部表示差異
可量化比較不同模型的特徵表示相似度
特徵工程
下游任務特徵提取
為下游任務提取預訓練模型的中間層特徵
提供更豐富的特徵表示
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase