G

German Semantic V3

由 aari1995 开发
专注于德语语义理解的句子嵌入模型,支持可变序列长度和套娃式嵌入,知识更新至2020年后
下载量 1,646
发布时间 : 6/23/2024

模型简介

用于生成德语语义句子嵌入向量的模型,支持句子相似度计算和特征提取

模型特点

灵活性
支持可变序列长度和嵌入截断训练,最大支持8192个token
套娃式嵌入
支持1024至64维的嵌入尺寸,能以微小质量损失大幅缩减存储空间
纯德语模型
专注德语场景,蕴含丰富的德国文化知识,专用分词器处理短查询更高效
更新知识
基于gbert-large模型,通过10亿德语fineweb tokens进行第二阶段预训练
鲁棒性
强化对拼写错误和大小写的容错能力,嵌入稳定性更高

模型能力

德语语义理解
句子相似度计算
特征提取
长文本处理

使用案例

语义搜索
政治人物搜索
识别与政治人物相关的描述
能正确关联'联邦总理'与'安格拉·默克尔'、'奥拉夫·肖尔茨'
内容理解
病毒相关术语
区分'新冠病毒'与相似词汇
能正确区分'新冠病毒'与'病毒'、'皇冠'、'啤酒'
行为识别
人类活动识别
理解描述人类活动的句子
能区分'一名男子练习拳击'与'一只猴子练习武术'等相似描述
AIbase
智启未来,您的人工智能解决方案智库
© 2025AIbase