高效檢索

# 高效檢索

Qwen3 Embedding 0.6B Onnx Uint8

這是一個基於ONNX的量化模型，是Qwen/Qwen3-Embedding-0.6B的uint8量化版本，在保持檢索性能的同時減少了模型大小。

Mass Academy Faq Embedder I1 GGUF

本模型是ntproctor/mass-academy-faq-embedder的量化版本，提供多種量化類型選擇，適用於高效的特徵提取和句子相似度計算。

Transformers 英語

Qwen3 Embedding 4B W4A16 G128

這是經過GPTQ量化的Qwen3-Embedding-4B模型，顯存使用量顯著降低，性能損失較小。

Gte Modernbert Base

基於ModernBERT預訓練編碼器的文本嵌入模型，支持8192 tokens長文本處理，在MTEB、LoCO和COIR等評估任務中表現優異。

Transformers 英語

Snowflake Arctic Embed L V2.0 GGUF

Snowflake Arctic Embed L v2.0的GGUF量化版本，是一種高效的多語言文本嵌入模型，適用於高質量檢索任務。

Granite Embedding 278m Multilingual GGUF

IBM Granite多語言嵌入模型，支持12種語言的文本嵌入任務，適用於信息檢索和多語言應用場景。

文本嵌入支持多種語言

Chuxin Embedding Q4 K M GGUF

這是一個從Chuxin-Embedding轉換而來的GGUF格式模型，主要用於中文文本檢索任務。

文本嵌入中文

bge_micro 是一個基於 sentence-transformers 的句子嵌入模型，專注於句子相似度計算和特徵提取任務。

SmartComponents

GTE-Base 是一個通用的文本嵌入模型，能夠將文本轉換為高維向量表示，適用於文本分類和相似性搜索任務。

Vectorizer V1 S Multilingual

Sinequa開發的多語言向量化器，能夠為輸入的段落或查詢生成嵌入向量，用於相似度計算和信息檢索。

Transformers 支持多種語言

精選推薦AI模型

Llama 3 Typhoon V1.5x 8b Instruct

專為泰語設計的80億參數指令模型，性能媲美GPT-3.5-turbo，優化了應用場景、檢索增強生成、受限生成和推理任務

大型語言模型

Transformers 支持多種語言

Cadet-Tiny是一個基於SODA數據集訓練的超小型對話模型，專為邊緣設備推理設計，體積僅為Cosmo-3B模型的2%左右。

Transformers 英語

Roberta Base Chinese Extractive Qa

基於RoBERTa架構的中文抽取式問答模型，適用於從給定文本中提取答案的任務。

問答系統中文

AIbase

智啟未來，您的人工智能解決方案智庫

English 简体中文繁體中文にほんご

© 2025AIbase