R

Roberta Base Nli Stsb Theseus Bg

Developed by rmihaylov
這是一個多語言Roberta模型,可用於生成保加利亞語句子的嵌入向量,基於Sentence-BERT理念訓練,支持保加利亞語和英語。
Downloads 14
Release Time : 4/18/2022

Model Overview

該模型基於Sentence-BERT理念訓練,核心思想是翻譯後的句子應與原句在向量空間中映射到相同位置。模型區分大小寫,後期通過漸進式模塊替換技術進行了壓縮優化。

Model Features

多語言支持
支持保加利亞語和英語的句子嵌入生成
區分大小寫
能夠區分單詞的大小寫形式,如'bulgarian'和'Bulgarian'會被視為不同詞彙
漸進式模塊替換優化
通過漸進式模塊替換技術進行了壓縮優化,提高了模型效率
基於Sentence-BERT理念
採用Sentence-BERT的訓練方法,使翻譯對在向量空間中映射到相近位置

Model Capabilities

句子嵌入生成
跨語言句子相似度計算
文本語義匹配

Use Cases

信息檢索
跨語言文檔檢索
使用保加利亞語查詢檢索相關英語文檔
問答系統
相似問題匹配
在問答系統中匹配語義相似的保加利亞語問題
如示例所示,能準確識別與'餅乾成分'最相關的問題
AIbase
Empowering the Future, Your AI Solution Knowledge Base
© 2025AIbase