German Semantic V3
专注于德语语义理解的句子嵌入模型,支持可变序列长度和套娃式嵌入,知识更新至2020年后
Downloads 1,646
Release Time : 6/23/2024
Model Overview
用于生成德语语义句子嵌入向量的模型,支持句子相似度计算和特征提取
Model Features
灵活性
支持可变序列长度和嵌入截断训练,最大支持8192个token
套娃式嵌入
支持1024至64维的嵌入尺寸,能以微小质量损失大幅缩减存储空间
纯德语模型
专注德语场景,蕴含丰富的德国文化知识,专用分词器处理短查询更高效
更新知识
基于gbert-large模型,通过10亿德语fineweb tokens进行第二阶段预训练
鲁棒性
强化对拼写错误和大小写的容错能力,嵌入稳定性更高
Model Capabilities
德语语义理解
句子相似度计算
特征提取
长文本处理
Use Cases
语义搜索
政治人物搜索
识别与政治人物相关的描述
能正确关联'联邦总理'与'安格拉·默克尔'、'奥拉夫·肖尔茨'
内容理解
病毒相关术语
区分'新冠病毒'与相似词汇
能正确区分'新冠病毒'与'病毒'、'皇冠'、'啤酒'
行为识别
人类活动识别
理解描述人类活动的句子
能区分'一名男子练习拳击'与'一只猴子练习武术'等相似描述
Featured Recommended AI Models
Llama 3 Typhoon V1.5x 8b Instruct
专为泰语设计的80亿参数指令模型,性能媲美GPT-3.5-turbo,优化了应用场景、检索增强生成、受限生成和推理任务
大型语言模型
Transformers Supports Multiple Languages

L
scb10x
3,269
16
Cadet Tiny
Openrail
Cadet-Tiny是一个基于SODA数据集训练的超小型对话模型,专为边缘设备推理设计,体积仅为Cosmo-3B模型的2%左右。
对话系统
Transformers English

C
ToddGoldfarb
2,691
6
Roberta Base Chinese Extractive Qa
基于RoBERTa架构的中文抽取式问答模型,适用于从给定文本中提取答案的任务。
问答系统 Chinese
R
uer
2,694
98