C

Colbert ModernBERT Base Turkish Uncased

由99eren99開發
這是一個基於PyLate從ModernBERT-base-Turkish-uncased-mlm微調的土耳其語模型,用於句子相似度計算和文檔重排序。
下載量 74
發布時間 : 2/14/2025

模型概述

該模型將句子和段落映射為128維密集向量序列,支持使用MaxSim操作符進行語義文本相似度計算,適用於土耳其語文本檢索和重排序任務。

模型特點

長上下文處理
支持長達8192 token的文檔處理,適合長文本檢索場景
高效檢索
利用Voyager HNSW索引實現快速文檔檢索
多粒度表示
生成128維密集向量序列,保留文本的細粒度語義信息

模型能力

語義文本相似度計算
文檔檢索
查詢-文檔匹配
搜索結果重排序

使用案例

信息檢索
文檔搜索引擎
構建土耳其語文檔搜索引擎,提高搜索結果相關性
nDCG和召回率指標提升
問答系統
用於問答系統中答案候選的重排序
提高答案准確率
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase