# 跨語言檢索

Qwen3 Embedding 8B Auto
Apache-2.0
Qwen3 Embedding 模型系列是通義家族的最新自研模型,專為文本嵌入和排序任務設計,支持100多種語言,在MTEB多語言排行榜上排名第一。
文本嵌入
Q
michaelfeil
135
1
Multilingual E5 Large Pooled Q8 0 GGUF
MIT
多語言E5大型池化模型,支持多種語言的句子相似度計算和特徵提取任務。
文本嵌入 支持多種語言
M
falan42
56
1
Nomic Embed Text V2 GGUF
Apache-2.0
Nomic Embed Text V2 GGUF 是一個多語言文本嵌入模型,支持超過70種語言,適用於句子相似度計算和特徵提取任務。
文本嵌入 支持多種語言
N
ggml-org
317
3
GIST Embedding V0
MIT
GIST-Embedding-v0 是一個基於 sentence-transformers 的句子嵌入模型,主要用於句子相似度計算和特徵提取任務。
文本嵌入 英語
G
avsolatorio
252.21k
26
Bge Multilingual Gemma2 GPTQ
Apache-2.0
這是BAAI/bge-multilingual-gemma2模型的4位GPTQ量化版本,支持多語言文本嵌入任務。
文本嵌入 Transformers
B
shuyuej
34
5
Multilingual E5 Large Instruct Q8 0 GGUF
MIT
多語言E5大型指令模型,支持多種語言的文本嵌入和分類任務,具有強大的跨語言能力。
大型語言模型 支持多種語言
M
Gomez12
90
1
Medical Embedded V2
Apache-2.0
這是一個多語言的句子嵌入模型,能夠將句子和段落映射到512維的密集向量空間,適用於聚類和語義搜索等任務。
文本嵌入 支持多種語言
M
shtilev
516
1
Mxbai Rerank Large V2 Seq
Apache-2.0
一個支持多種語言的句子轉換器模型,適用於文本排序任務
大型語言模型 Transformers 支持多種語言
M
michaelfeil
210
8
Bge Reranker V2 M3 Q8 0 GGUF
Apache-2.0
這是一個基於BAAI/bge-reranker-v2-m3模型轉換的GGUF格式文本排序模型,支持多語言文本嵌入推理。
文本嵌入 其他
B
pqnet
54
0
Granite Embedding 107m Multilingual Onnx
Apache-2.0
IBM開發的107M參數多語言嵌入模型,支持12種語言,在MTEB基準測試中表現優異
文本嵌入 Transformers 支持多種語言
G
gety-ai
53
1
Nomic Embed Text V2 Moe Unsupervised
這是一個多語言混合專家(MoE)文本嵌入模型的中間版本,經過多階段對比訓練得到
文本嵌入
N
nomic-ai
161
5
Multilingual E5 Large Instruct GGUF
MIT
多語言E5大型指令模型,支持多種語言的文本嵌入和分類任務
大型語言模型 支持多種語言
M
Impulse2000
58
1
Jina Embeddings V3
Jina Embeddings V3 是一個多語言句子嵌入模型,支持超過100種語言,專注於句子相似度計算和特徵提取任務。
文本嵌入 Transformers 支持多種語言
J
Daxtra
55
1
Snowflake Arctic Embed M V2.0 Cpu
Apache-2.0
Snowflake Arctic Embed M v2.0 是一個多語言句子嵌入模型,專注於句子相似度任務,支持超過50種語言。
文本嵌入 Transformers 支持多種語言
S
cnmoro
502
3
Lb Reranker 0.5B V1.0 GGUF
Apache-2.0
這是一個基於0.5B參數的文本重排序模型,支持多種語言的文本排序任務。
大型語言模型 支持多種語言
L
bartowski
1,616
4
Multilingual E5 Large Instruct Q3 K S GGUF
MIT
多語言E5大型指令模型,支持多種語言和任務,包括分類、檢索、聚類等。
大型語言模型 支持多種語言
M
yoeven
14
1
Multilingual E5 Large Instruct Q5 0 GGUF
MIT
多語言E5大型指令模型,支持多種語言的文本嵌入和分類任務
大型語言模型 支持多種語言
M
yoeven
14
2
Colqwen2 2b V1.0
基於Qwen2-VL-2B-Instruct與ColBERT策略的視覺檢索模型,能夠生成多向量文本與圖像表示
文本生成圖像 支持多種語言
C
tsystems
700
1
Gme Qwen2 VL 7B Instruct
Apache-2.0
Qwen2-VL-7B-Instruct 是一個基於 Qwen2 架構的多模態視覺語言模型,支持中英文,適用於多種自然語言處理任務。
文本生成圖像 Transformers 支持多種語言
G
Alibaba-NLP
3,844
34
Snowflake Arctic Embed L V2.0
Apache-2.0
Snowflake Arctic Embed v2.0 是一個多語言句子嵌入模型,支持超過100種語言的文本特徵提取和句子相似度計算。
文本嵌入 Transformers 支持多種語言
S
Snowflake
231.00k
156
Snowflake Arctic Embed M V2.0
Apache-2.0
Snowflake Arctic Embed M v2.0 是一個多語言句子嵌入模型,支持超過50種語言,專注於句子相似度和特徵提取任務。
文本嵌入 Transformers 支持多種語言
S
Snowflake
92.30k
76
Mind Map Blog Model
這是一個從sentence-transformers/paraphrase-multilingual-MiniLM-L12-v2微調的句子轉換器模型,可將文本映射到384維向量空間,用於語義相似度計算等任務
文本嵌入
M
hothanhtienqb
463
2
Jina Embeddings V3
Jina Embeddings V3 是一個多語言句子嵌入模型,支持超過100種語言,專注於句子相似度計算和特徵提取任務。
文本嵌入 Transformers 支持多種語言
J
arkohut
506
4
Arabic English Sts Matryoshka V2.0
基於FacebookAI/xlm-roberta-large微調的雙語句子轉換器模型,支持阿拉伯語和英語的語義文本相似度計算。
文本嵌入 支持多種語言
A
omarelshehy
1,072
3
Gte Qwen2 1.5B Instruct GGUF
Apache-2.0
基於Qwen2架構的7B參數規模句子嵌入模型,專注於句子相似度任務,在MTEB基準測試中表現優異。
大型語言模型
G
mav23
169
2
Vectorizer.guava
由Sinequa開發的向量化工具,能夠根據輸入的段落或查詢生成嵌入向量,用於句子相似度計算和檢索任務。
文本嵌入 PyTorch 支持多種語言
V
sinequa
204
1
Multilingual E5 Large Pooled
MIT
Multilingual E5 Large 是一個多語言句子轉換器模型,專注於句子相似度和特徵提取任務,支持多種語言。
文本嵌入 支持多種語言
M
Hiveurban
3,803
2
Bge Reranker V2 M3 En Ru
MIT
這是BAAI/bge-reranker-v2-m3的精簡版本,僅保留英文和俄文的詞彙表,比原始模型小1.5倍,同時能生成相同的嵌入向量。
文本嵌入 Transformers 支持多種語言
B
qilowoq
677
6
Multilingual E5 Large Instruct GGUF
MIT
多語言E5大型指令模型,支持100多種語言的文本嵌入和分類任務
大型語言模型 支持多種語言
M
KeyurRamoliya
224
3
Multilingual E5 Large Instruct GGUF
MIT
多語言e5系列是多語言嵌入模型的最佳選擇之一,支持多種語言和任務。
文本嵌入
M
Ralriki
13.17k
5
Gte Multilingual Mlm Base
Apache-2.0
mGTE系列多語言文本編碼器,支持75種語言,最大上下文長度8192,基於BERT+RoPE+GLU架構,在GLUE和XTREME-R基準上表現優異
大型語言模型 Safetensors
G
Alibaba-NLP
342
12
Ru En RoSBERTa
MIT
基於RoBERTa架構的雙語(俄語-英語)文本處理模型,適用於多種分類和檢索任務
文本嵌入 Transformers 支持多種語言
R
ai-forever
15.95k
37
Gte Multilingual Reranker Base
Apache-2.0
GTE系列中的首個多語言重排序模型,支持70+語言,具備高性能和長文本處理能力。
文本嵌入 Transformers 支持多種語言
G
Alibaba-NLP
239.91k
122
Bge M3 En Ru
適用於英語和俄語的bge-m3模型,詞彙表精簡版本,保留了英語和俄語的詞彙,詞彙量縮減至原版的21%,整體模型參數量為原版的63.3%,且不影響英語和俄語嵌入的質量。
文本嵌入 Transformers 支持多種語言
B
TatonkaHF
1,174
7
Bloomz 560m Retriever V2
Openrail
基於Bloomz-560m-dpo-chat模型的雙編碼器,用於將文章和查詢映射到同一向量空間,支持法語和英語的跨語言檢索。
文本嵌入 Transformers 支持多種語言
B
cmarkea
17
2
All Indo E5 Small V4
這是一個基於sentence-transformers的印尼語文本嵌入模型,能將句子和段落映射到384維稠密向量空間,適用於聚類和語義搜索等任務。
文本嵌入 Transformers
A
LazarusNLP
3,039
7
Sentence Transformers Multilingual E5 Small
MIT
multilingual-e5-small 是一個在多語言文本處理任務中表現出色的模型,支持分類、檢索、聚類、重排序、語義文本相似度等多種任務。
文本嵌入 支持多種語言
S
beademiguelperez
3,922
1
Bce Embedding Base V1
Apache-2.0
BCEmbedding是網易有道研發的雙語跨語言嵌入模型庫,包含EmbeddingModel(語義向量生成)和RerankerModel(結果精排)兩類模型。作為有道檢索增強生成(RAG)系統的核心組件,已成功應用於開源項目QAnything及有道速讀、有道翻譯等產品。
文本嵌入 Transformers 支持多種語言
B
maidalun1020
69.82k
375
Ko Reranker
MIT
基於BAAI/bge-reranker-large針對韓語數據進行微調的Reranker模型,用於提升韓語檢索增強生成(RAG)性能
文本嵌入 Transformers 支持多種語言
K
Dongjin-kr
34.08k
59
Sentence Swissbert
基於瑞士多語言新聞數據訓練的句子嵌入模型,支持瑞士四種官方語言
文本嵌入 Transformers 支持多種語言
S
jgrosjean-mathesis
169
2
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase