B

Bi Encoder Mnrl Dbmdz Bert Base Turkish Cased Margin 3.0 Msmarco Tr 10k

Developed by oguuzhansahin
这是一个基于sentence-transformers的土耳其语文本嵌入模型,可将句子和段落映射到768维向量空间,适用于语义搜索和相似度计算任务。
Downloads 441
Release Time : 12/9/2023

Model Overview

该模型基于dbmdz/bert-base-turkish-cased架构,使用margin_3.0损失函数在msmarco-tr-10k数据集上微调,专门针对土耳其语文本的语义相似度计算和检索任务优化。

Model Features

土耳其语优化
专门针对土耳其语文本进行优化,能更好地处理土耳其语的语言特性
高维语义表示
将文本映射到768维密集向量空间,捕捉深层语义信息
高效检索能力
适用于大规模文本检索场景,能快速计算文本相似度

Model Capabilities

文本嵌入生成
语义相似度计算
文本检索
聚类分析

Use Cases

信息检索
文档搜索
在土耳其语文档库中快速检索与查询语义相关的文档
能准确找到与查询意图匹配的相关文档
问答系统
FAQ匹配
将用户问题与预定义的FAQ问题进行语义匹配
提高FAQ系统的回答准确率
AIbase
Empowering the Future, Your AI Solution Knowledge Base
© 2025AIbase