G

German Semantic V3

由aari1995開發
專注於德語語義理解的句子嵌入模型,支持可變序列長度和套娃式嵌入,知識更新至2020年後
下載量 1,646
發布時間 : 6/23/2024

模型概述

用於生成德語語義句子嵌入向量的模型,支持句子相似度計算和特徵提取

模型特點

靈活性
支持可變序列長度和嵌入截斷訓練,最大支持8192個token
套娃式嵌入
支持1024至64維的嵌入尺寸,能以微小質量損失大幅縮減存儲空間
純德語模型
專注德語場景,蘊含豐富的德國文化知識,專用分詞器處理短查詢更高效
更新知識
基於gbert-large模型,通過10億德語fineweb tokens進行第二階段預訓練
魯棒性
強化對拼寫錯誤和大小寫的容錯能力,嵌入穩定性更高

模型能力

德語語義理解
句子相似度計算
特徵提取
長文本處理

使用案例

語義搜索
政治人物搜索
識別與政治人物相關的描述
能正確關聯'聯邦總理'與'安格拉·默克爾'、'奧拉夫·肖爾茨'
內容理解
病毒相關術語
區分'新冠病毒'與相似詞彙
能正確區分'新冠病毒'與'病毒'、'皇冠'、'啤酒'
行為識別
人類活動識別
理解描述人類活動的句子
能區分'一名男子練習拳擊'與'一隻猴子練習武術'等相似描述
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase