R

Roberta Base Nli Stsb Theseus Bg

由rmihaylov開發
這是一個多語言Roberta模型,可用於生成保加利亞語句子的嵌入向量,基於Sentence-BERT理念訓練,支持保加利亞語和英語。
下載量 14
發布時間 : 4/18/2022

模型概述

該模型基於Sentence-BERT理念訓練,核心思想是翻譯後的句子應與原句在向量空間中映射到相同位置。模型區分大小寫,後期通過漸進式模塊替換技術進行了壓縮優化。

模型特點

多語言支持
支持保加利亞語和英語的句子嵌入生成
區分大小寫
能夠區分單詞的大小寫形式,如'bulgarian'和'Bulgarian'會被視為不同詞彙
漸進式模塊替換優化
通過漸進式模塊替換技術進行了壓縮優化,提高了模型效率
基於Sentence-BERT理念
採用Sentence-BERT的訓練方法,使翻譯對在向量空間中映射到相近位置

模型能力

句子嵌入生成
跨語言句子相似度計算
文本語義匹配

使用案例

信息檢索
跨語言文檔檢索
使用保加利亞語查詢檢索相關英語文檔
問答系統
相似問題匹配
在問答系統中匹配語義相似的保加利亞語問題
如示例所示,能準確識別與'餅乾成分'最相關的問題
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase