M

Minilm L6 Danish Encoder

由 KennethTM 开发
这是一个轻量级的丹麦语句子嵌入模型,基于英文MiniLM模型调整,适用于丹麦语文本处理任务。
下载量 5,802
发布时间 : 1/9/2024

模型简介

该模型能将丹麦语句子和段落映射到384维向量空间,支持聚类和语义搜索等任务。基于英文MiniLM模型调整,使用丹麦语分词器,并在机器翻译的丹麦语数据上训练。

模型特点

轻量级设计
仅约2200万参数,计算资源需求低
丹麦语优化
使用丹麦语分词器专门调整,适合丹麦语文本处理
长文本支持
最大支持512个标记的序列长度
迁移学习
基于英文MiniLM模型调整,而非从头训练

模型能力

文本嵌入
句子相似度计算
语义搜索
文本聚类

使用案例

信息检索
丹麦语语义搜索
构建丹麦语搜索引擎,实现基于语义而非关键词的搜索
能理解查询意图,返回相关结果
文本分析
丹麦语文本聚类
对丹麦语文档或用户评论进行自动分组
发现相似内容或主题
AIbase
智启未来,您的人工智能解决方案智库
© 2025AIbase