G

German Semantic V3

Developed by aari1995
专注于德语语义理解的句子嵌入模型,支持可变序列长度和套娃式嵌入,知识更新至2020年后
Downloads 1,646
Release Time : 6/23/2024

Model Overview

用于生成德语语义句子嵌入向量的模型,支持句子相似度计算和特征提取

Model Features

灵活性
支持可变序列长度和嵌入截断训练,最大支持8192个token
套娃式嵌入
支持1024至64维的嵌入尺寸,能以微小质量损失大幅缩减存储空间
纯德语模型
专注德语场景,蕴含丰富的德国文化知识,专用分词器处理短查询更高效
更新知识
基于gbert-large模型,通过10亿德语fineweb tokens进行第二阶段预训练
鲁棒性
强化对拼写错误和大小写的容错能力,嵌入稳定性更高

Model Capabilities

德语语义理解
句子相似度计算
特征提取
长文本处理

Use Cases

语义搜索
政治人物搜索
识别与政治人物相关的描述
能正确关联'联邦总理'与'安格拉·默克尔'、'奥拉夫·肖尔茨'
内容理解
病毒相关术语
区分'新冠病毒'与相似词汇
能正确区分'新冠病毒'与'病毒'、'皇冠'、'啤酒'
行为识别
人类活动识别
理解描述人类活动的句子
能区分'一名男子练习拳击'与'一只猴子练习武术'等相似描述
AIbase
Empowering the Future, Your AI Solution Knowledge Base
© 2025AIbase