T

Turkish Base Bert Uncased Mean Nli Stsb Tr

由atasoglu開發
這是一個基於土耳其語BERT模型的句子嵌入模型,適用於句子相似度計算和語義搜索任務。
下載量 744
發布時間 : 2/17/2024

模型概述

該模型能將土耳其語句子和段落映射到768維稠密向量空間,適用於聚類或語義搜索等任務。基於ytu-ce-cosmos/turkish-base-bert-uncased微調,訓練數據集包括nli_tr和emrecan/stsb-mt-turkish。

模型特點

土耳其語優化
專門針對土耳其語進行優化和微調,適合處理土耳其語文本。
句子嵌入
能將句子和段落映射到768維稠密向量空間,保留語義信息。
小寫處理
需要手動將輸入文本轉為小寫,包括特殊字符如'I'轉為'ı'。
高性能
在STS-b測試集上表現出色,餘弦相似度Pearson達到0.8401。

模型能力

句子相似度計算
語義搜索
文本聚類
特徵提取

使用案例

信息檢索
語義搜索
用於構建土耳其語語義搜索引擎,根據查詢返回語義相似的文檔。
提高搜索結果的相關性
文本分析
文檔聚類
對土耳其語文檔進行自動聚類,發現相似文檔組。
提高文檔組織效率
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase