B

Bi Encoder Mnrl Dbmdz Bert Base Turkish Cased Margin 3.0 Msmarco Tr 10k

由oguuzhansahin開發
這是一個基於sentence-transformers的土耳其語文本嵌入模型,可將句子和段落映射到768維向量空間,適用於語義搜索和相似度計算任務。
下載量 441
發布時間 : 12/9/2023

模型概述

該模型基於dbmdz/bert-base-turkish-cased架構,使用margin_3.0損失函數在msmarco-tr-10k數據集上微調,專門針對土耳其語文本的語義相似度計算和檢索任務優化。

模型特點

土耳其語優化
專門針對土耳其語文本進行優化,能更好地處理土耳其語的語言特性
高維語義表示
將文本映射到768維密集向量空間,捕捉深層語義信息
高效檢索能力
適用於大規模文本檢索場景,能快速計算文本相似度

模型能力

文本嵌入生成
語義相似度計算
文本檢索
聚類分析

使用案例

信息檢索
文檔搜索
在土耳其語文檔庫中快速檢索與查詢語義相關的文檔
能準確找到與查詢意圖匹配的相關文檔
問答系統
FAQ匹配
將用戶問題與預定義的FAQ問題進行語義匹配
提高FAQ系統的回答準確率
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase