跨語言檢索

# 跨語言檢索

Qwen3 Embedding 8B Auto

Qwen3 Embedding 模型系列是通義家族的最新自研模型，專為文本嵌入和排序任務設計，支持100多種語言，在MTEB多語言排行榜上排名第一。

Multilingual E5 Large Pooled Q8 0 GGUF

多語言E5大型池化模型，支持多種語言的句子相似度計算和特徵提取任務。

文本嵌入支持多種語言

Nomic Embed Text V2 GGUF

Nomic Embed Text V2 GGUF 是一個多語言文本嵌入模型，支持超過70種語言，適用於句子相似度計算和特徵提取任務。

文本嵌入支持多種語言

GIST Embedding V0

GIST-Embedding-v0 是一個基於 sentence-transformers 的句子嵌入模型，主要用於句子相似度計算和特徵提取任務。

文本嵌入英語

Bge Multilingual Gemma2 GPTQ

這是BAAI/bge-multilingual-gemma2模型的4位GPTQ量化版本，支持多語言文本嵌入任務。

Multilingual E5 Large Instruct Q8 0 GGUF

多語言E5大型指令模型，支持多種語言的文本嵌入和分類任務，具有強大的跨語言能力。

大型語言模型支持多種語言

Medical Embedded V2

這是一個多語言的句子嵌入模型，能夠將句子和段落映射到512維的密集向量空間，適用於聚類和語義搜索等任務。

文本嵌入支持多種語言

Mxbai Rerank Large V2 Seq

一個支持多種語言的句子轉換器模型，適用於文本排序任務

大型語言模型

Transformers 支持多種語言

Bge Reranker V2 M3 Q8 0 GGUF

這是一個基於BAAI/bge-reranker-v2-m3模型轉換的GGUF格式文本排序模型，支持多語言文本嵌入推理。

文本嵌入其他

Granite Embedding 107m Multilingual Onnx

IBM開發的107M參數多語言嵌入模型，支持12種語言，在MTEB基準測試中表現優異

Transformers 支持多種語言

Nomic Embed Text V2 Moe Unsupervised

這是一個多語言混合專家(MoE)文本嵌入模型的中間版本，經過多階段對比訓練得到

Multilingual E5 Large Instruct GGUF

多語言E5大型指令模型，支持多種語言的文本嵌入和分類任務

大型語言模型支持多種語言

Jina Embeddings V3

Jina Embeddings V3 是一個多語言句子嵌入模型，支持超過100種語言，專注於句子相似度計算和特徵提取任務。

Transformers 支持多種語言

Snowflake Arctic Embed M V2.0 Cpu

Snowflake Arctic Embed M v2.0 是一個多語言句子嵌入模型，專注於句子相似度任務，支持超過50種語言。

Transformers 支持多種語言

Lb Reranker 0.5B V1.0 GGUF

這是一個基於0.5B參數的文本重排序模型，支持多種語言的文本排序任務。

大型語言模型支持多種語言

Multilingual E5 Large Instruct Q3 K S GGUF

多語言E5大型指令模型，支持多種語言和任務，包括分類、檢索、聚類等。

大型語言模型支持多種語言

Multilingual E5 Large Instruct Q5 0 GGUF

多語言E5大型指令模型，支持多種語言的文本嵌入和分類任務

大型語言模型支持多種語言

Colqwen2 2b V1.0

基於Qwen2-VL-2B-Instruct與ColBERT策略的視覺檢索模型，能夠生成多向量文本與圖像表示

文本生成圖像支持多種語言

Gme Qwen2 VL 7B Instruct

Qwen2-VL-7B-Instruct 是一個基於 Qwen2 架構的多模態視覺語言模型，支持中英文，適用於多種自然語言處理任務。

文本生成圖像

Transformers 支持多種語言

Snowflake Arctic Embed L V2.0

Snowflake Arctic Embed v2.0 是一個多語言句子嵌入模型，支持超過100種語言的文本特徵提取和句子相似度計算。

Transformers 支持多種語言

Snowflake Arctic Embed M V2.0

Snowflake Arctic Embed M v2.0 是一個多語言句子嵌入模型，支持超過50種語言，專注於句子相似度和特徵提取任務。

Transformers 支持多種語言

Mind Map Blog Model

這是一個從sentence-transformers/paraphrase-multilingual-MiniLM-L12-v2微調的句子轉換器模型，可將文本映射到384維向量空間，用於語義相似度計算等任務

Jina Embeddings V3

Jina Embeddings V3 是一個多語言句子嵌入模型，支持超過100種語言，專注於句子相似度計算和特徵提取任務。

Transformers 支持多種語言

Arabic English Sts Matryoshka V2.0

基於FacebookAI/xlm-roberta-large微調的雙語句子轉換器模型，支持阿拉伯語和英語的語義文本相似度計算。

文本嵌入支持多種語言

Gte Qwen2 1.5B Instruct GGUF

基於Qwen2架構的7B參數規模句子嵌入模型，專注於句子相似度任務，在MTEB基準測試中表現優異。

大型語言模型

Vectorizer.guava

由Sinequa開發的向量化工具，能夠根據輸入的段落或查詢生成嵌入向量，用於句子相似度計算和檢索任務。

PyTorch 支持多種語言

Multilingual E5 Large Pooled

Multilingual E5 Large 是一個多語言句子轉換器模型，專注於句子相似度和特徵提取任務，支持多種語言。

文本嵌入支持多種語言

Bge Reranker V2 M3 En Ru

這是BAAI/bge-reranker-v2-m3的精簡版本，僅保留英文和俄文的詞彙表，比原始模型小1.5倍，同時能生成相同的嵌入向量。

Transformers 支持多種語言

Multilingual E5 Large Instruct GGUF

多語言E5大型指令模型，支持100多種語言的文本嵌入和分類任務

大型語言模型支持多種語言

Multilingual E5 Large Instruct GGUF

多語言e5系列是多語言嵌入模型的最佳選擇之一，支持多種語言和任務。

Gte Multilingual Mlm Base

mGTE系列多語言文本編碼器，支持75種語言，最大上下文長度8192，基於BERT+RoPE+GLU架構，在GLUE和XTREME-R基準上表現優異

大型語言模型

基於RoBERTa架構的雙語（俄語-英語）文本處理模型，適用於多種分類和檢索任務

Transformers 支持多種語言

Gte Multilingual Reranker Base

GTE系列中的首個多語言重排序模型，支持70+語言，具備高性能和長文本處理能力。

Transformers 支持多種語言

適用於英語和俄語的bge-m3模型，詞彙表精簡版本，保留了英語和俄語的詞彙，詞彙量縮減至原版的21%，整體模型參數量為原版的63.3%，且不影響英語和俄語嵌入的質量。

Transformers 支持多種語言

Bloomz 560m Retriever V2

基於Bloomz-560m-dpo-chat模型的雙編碼器，用於將文章和查詢映射到同一向量空間，支持法語和英語的跨語言檢索。

Transformers 支持多種語言

All Indo E5 Small V4

這是一個基於sentence-transformers的印尼語文本嵌入模型，能將句子和段落映射到384維稠密向量空間，適用於聚類和語義搜索等任務。

Sentence Transformers Multilingual E5 Small

multilingual-e5-small 是一個在多語言文本處理任務中表現出色的模型，支持分類、檢索、聚類、重排序、語義文本相似度等多種任務。

文本嵌入支持多種語言

beademiguelperez

Bce Embedding Base V1

BCEmbedding是網易有道研發的雙語跨語言嵌入模型庫，包含EmbeddingModel（語義向量生成）和RerankerModel（結果精排）兩類模型。作為有道檢索增強生成（RAG）系統的核心組件，已成功應用於開源項目QAnything及有道速讀、有道翻譯等產品。

Transformers 支持多種語言

基於BAAI/bge-reranker-large針對韓語數據進行微調的Reranker模型，用於提升韓語檢索增強生成(RAG)性能

Transformers 支持多種語言

Sentence Swissbert

基於瑞士多語言新聞數據訓練的句子嵌入模型，支持瑞士四種官方語言

Transformers 支持多種語言

jgrosjean-mathesis

精選推薦AI模型

Llama 3 Typhoon V1.5x 8b Instruct

專為泰語設計的80億參數指令模型，性能媲美GPT-3.5-turbo，優化了應用場景、檢索增強生成、受限生成和推理任務

大型語言模型

Transformers 支持多種語言

Cadet-Tiny是一個基於SODA數據集訓練的超小型對話模型，專為邊緣設備推理設計，體積僅為Cosmo-3B模型的2%左右。

Transformers 英語

Roberta Base Chinese Extractive Qa

基於RoBERTa架構的中文抽取式問答模型，適用於從給定文本中提取答案的任務。

問答系統中文

AIbase

智啟未來，您的人工智能解決方案智庫

English 简体中文繁體中文にほんご

© 2025AIbase