T

Tooka SBERT V2 Small

由 PartAI 开发
Tooka-SBERT-V2-Small 是一个经过训练的句子转换器模型,用于语义文本相似度和嵌入任务。它能将句子和段落映射到一个密集向量空间,在这个空间中,语义相似的文本会靠得很近。
下载量 110
发布时间 : 5/13/2025

模型简介

该模型专门用于处理波斯语文本的语义相似度和嵌入任务,通过两阶段训练(预训练和微调)优化性能。

模型特点

两阶段训练
模型经过预训练和微调两个阶段,分别在Targoman News数据集和多个合成数据集上进行优化。
非对称输入处理
支持在输入前添加特定前缀(如'سوال:'和'متن:')以区分不同类型文本,优化语义理解。
高效性能
在PTEB Benchmark上表现优异,平均性能优于mE5-Base模型。

模型能力

语义文本相似度计算
文本嵌入生成
波斯语文本处理

使用案例

信息检索
文档检索
使用模型生成的嵌入进行文档相似性搜索
在MIRACLRetrieval等数据集上表现良好
文本分类
情感分析
利用文本嵌入进行情感分类
在PersianFoodSentimentClassification等任务中有效
重排序
搜索结果优化
对初步检索结果进行语义重排序
在WikipediaRerankingMultilingual等任务中表现优异
AIbase
智启未来,您的人工智能解决方案智库
© 2025AIbase