B

Bi Encoder Mnrl Dbmdz Bert Base Turkish Cased Margin 3.0 Msmarco Tr 10k

Developed by oguuzhansahin
這是一個基於sentence-transformers的土耳其語文本嵌入模型,可將句子和段落映射到768維向量空間,適用於語義搜索和相似度計算任務。
Downloads 441
Release Time : 12/9/2023

Model Overview

該模型基於dbmdz/bert-base-turkish-cased架構,使用margin_3.0損失函數在msmarco-tr-10k數據集上微調,專門針對土耳其語文本的語義相似度計算和檢索任務優化。

Model Features

土耳其語優化
專門針對土耳其語文本進行優化,能更好地處理土耳其語的語言特性
高維語義表示
將文本映射到768維密集向量空間,捕捉深層語義信息
高效檢索能力
適用於大規模文本檢索場景,能快速計算文本相似度

Model Capabilities

文本嵌入生成
語義相似度計算
文本檢索
聚類分析

Use Cases

信息檢索
文檔搜索
在土耳其語文檔庫中快速檢索與查詢語義相關的文檔
能準確找到與查詢意圖匹配的相關文檔
問答系統
FAQ匹配
將用戶問題與預定義的FAQ問題進行語義匹配
提高FAQ系統的回答準確率
AIbase
Empowering the Future, Your AI Solution Knowledge Base
© 2025AIbase