檢索增強生成

# 檢索增強生成

All MiniLM L2 V2

該模型是從all-MiniLM-L12-v2蒸餾而來，推理速度提升近2倍，同時在CPU和GPU上保持較高的準確度。

文本嵌入支持多種語言

TreeHop是一個輕量級的嵌入級框架，用於高效處理多跳問答中的查詢嵌入生成與過濾，顯著降低計算開銷。

Qwen 2.5 7B Base RAG RL

Qwen-2.5-7B-base-RAG-RL 是一個基於未知數據集從頭開始訓練的7B參數規模的大語言模型，結合了檢索增強生成(RAG)和強化學習(RL)技術。

大型語言模型

Jina Reranker V2 Base Multilingual Wiki Tr Rag Prefix

基於jina-reranker-v2-base-multilingual微調的交叉編碼器模型，用於文本重排序和語義搜索

Pleias RAG 350M

Pleias-RAG-350M是一款3.5億參數的小型推理模型，專為檢索增強生成(RAG)、搜索和來源摘要任務而訓練。

大型語言模型

Transformers 支持多種語言

ReasonIR-8B是首個專為通用推理任務訓練的檢索模型，在BRIGHT基準上實現了最先進的檢索性能，並在RAG應用中顯著提升了MMLU和GPQA基準的表現。

Transformers 英語

Colnomic Embed Multimodal 3b

ColNomic Embed多模態3B是一款30億參數的多模態嵌入模型，專為視覺文檔檢索任務設計，支持多語言文本和圖像的統一編碼。

多模態融合支持多種語言

Mxbai Rerank Large V2 GGUF

本倉庫包含mixedbread-ai/mxbai-rerank-large-v2的GGUF格式模型文件，由TensorBlock提供的機器進行量化，兼容llama.cpp。

文本嵌入支持多種語言

Bge Reranker V2 M3 Q4 K M GGUF

本模型是基於BAAI/bge-reranker-v2-m3轉換的GGUF格式模型，用於文本排序任務，支持多語言。

文本嵌入其他

首個專為金融時間序列預測設計的檢索器，基於檢索增強生成（RAG）框架

大型語言模型

Transformers 英語

FinSeer StockLLM 是一個開源的10億參數大語言模型，專為金融時間序列預測設計，採用檢索增強生成（RAG）框架。

大型語言模型

Transformers 英語

Gen-8B-R2是一個專注於減少RAG系統中幻覺問題的生成模型，特別適用於處理檢索噪聲和信息過載的情況。

大型語言模型

Transformers 英語

C4ai Command A 03 2025

Cohere Labs Command A 是一個開放權重的1110億參數模型研究版本，專為需要快速、安全且高質量AI的嚴苛企業需求優化。

大型語言模型

Transformers 支持多種語言

Trendyol LLM 7B Chat V4.1.0

Trendyol LLM v4.1.0 是一款基於 Trendyol LLM base v4.0（在130億token上繼續預訓練的Qwen2.5 7B版本）的生成模型，專注於電商領域和土耳其語理解。

大型語言模型其他

Jbaron34 SmolLM2 135M Bebop Reranker Gguf

一個輕量級的文本排序模型，適用於重新排序搜索結果或文檔

Kanana Nano 2.1b Embedding

Kanana是由Kakao開發的雙語(韓語/英語)語言模型系列，在韓語任務上表現卓越，在英語任務上具備競爭力，相比同規模模型顯著降低計算成本。

大型語言模型

Transformers 支持多種語言

Gte Qwen2 7B Instruct GGUF

阿里巴巴NLP團隊開發的7B參數規模的多語言文本嵌入模型，專注於句子相似度任務，提供多種量化版本

大型語言模型英語

基於BertForTokenClassification的文本分塊器，適用於結構化和非結構化文本，特別優化用於RAG場景

Safetensors 支持多種語言

Pllum 12B Nc Chat

PLLuM-12B-chat是波蘭大語言模型家族中的120億參數對話優化版本，專為波蘭語及斯拉夫/波羅的海語言設計，通過指令微調和偏好學習實現安全高效的交互能力。

大型語言模型

Bge Reranker V2 M3 Q4 K M GGUF

本模型是BAAI/bge-reranker-v2-m3的GGUF量化版本，用於文本重排序任務，支持多語言。

文本嵌入其他

Fluxi AI Small Vision

Fluxi AI 是一款基於 Qwen2-VL-7B-Instruct 的多模態智能助手，具備文本、圖像和視頻處理能力，特別優化了葡萄牙語支持。

圖像生成文本

Transformers 其他

Jina Embeddings GGUF

Jina Embeddings V2 Base 是一個高效的英文句子嵌入模型，專注於句子相似度和特徵提取任務。

文本嵌入英語

Lb Reranker 0.5B V1.0

LB重排序器是用於判斷查詢與文本片段相關性的模型，支持95+種語言，適用於檢索任務中的排序和重排序。

大型語言模型

Transformers 支持多種語言

Granite 3.1 3b A800m Instruct

基於Granite-3.1-3B-A800M-Base微調的30億參數長上下文指令模型，支持多語言任務

大型語言模型

Ruri是一個針對日語優化的通用文本嵌入模型，基於Sentence Transformers架構，特別設計用於句子相似度計算和特徵提取任務。

文本嵌入日語

Llama3.1 8B Legal ThaiCCL Combine

Llama-3.1-Legal-ThaiCCL-8B 是基於 Llama-3.1-8B 構建的大語言模型，專門用於回答泰語法律問題。

大型語言模型

GATE Reranker V1

專為阿拉伯語文檔檢索與排序優化的高性能重排序模型

Transformers 阿拉伯語

Bge Reranker V2 M3 Q4 K M GGUF

該模型是從BAAI/bge-reranker-v2-m3轉換而來的GGUF格式模型，用於文本重排序任務，支持多語言。

文本嵌入其他

Vikhr Nemo 12B Instruct R 21 09 24

Vikhr-Nemo是基於Mistral-Nemo-Instruct-2407優化的雙語大語言模型，專為俄語和英語優化，支持邏輯推理、文本摘要、代碼生成等多種任務。

大型語言模型

Transformers 支持多種語言

Bge Reranker V2 Gemma IQ4 NL GGUF

這是BAAI/bge-reranker-v2-gemma模型的GGUF格式轉換版本，適用於llama.cpp框架，支持多語言文本分類任務。

文本嵌入其他

Datagemma Rag 27b It

DataGemma是基於Gemma 2微調的系列模型，專門用於幫助大語言模型訪問和整合Data Commons中的可靠公共統計數據。

大型語言模型

Gemma 2 2b It Chinese Kyara Dpo

Kyara是一個通過知識檢索增強的語言模型微調項目，專注於提升模型在繁體中文等資源較少語言上的表現。

大型語言模型

Transformers 支持多種語言

Llama 3 8B Instruct Finance RAG

基於Llama 3 8B Instruct微調的金融領域RAG模型，專門針對金融問答場景優化

大型語言模型

Transformers 英語

C4AI Command - R是一款擁有350億參數的高性能生成模型的研究版本，針對推理、總結和問答等多種用例進行了優化。

大型語言模型

Gte Qwen2 7B Instruct

基於Qwen2架構的7B參數規模的大語言模型，專注於句子相似度計算和文本嵌入任務。

大型語言模型

Phi3 Rag Relevance Judge Merge

一個用於判斷參考文本與問題相關性的二元分類模型，專為RAG系統優化

大型語言模型

Llama 3 Typhoon V1.5x 8b Instruct

專為泰語設計的80億參數指令模型，性能媲美GPT-3.5-turbo，優化了應用場景、檢索增強生成、受限生成和推理任務

大型語言模型

Transformers 支持多種語言

Llm2vec Meta Llama 3 8B Instruct Mntp

LLM2Vec是將僅解碼器架構的大語言模型轉化為文本編碼器的簡易方案，通過啟用雙向注意力機制、掩碼下一詞預測和無監督對比學習實現。

Transformers 英語

Llama3 ChatQA 1.5 70B

Llama3-ChatQA-1.5是基於Llama-3基礎模型開發的對話式問答和檢索增強生成模型，在對話式QA和RAG任務中表現卓越。

大型語言模型

Transformers 英語

Gte Base En V1.5

GTE-base-en-v1.5 是一個英文句子轉換器模型，專注於句子相似度任務，在多個文本嵌入基準測試中表現優異。

Transformers 支持多種語言

精選推薦AI模型

Llama 3 Typhoon V1.5x 8b Instruct

專為泰語設計的80億參數指令模型，性能媲美GPT-3.5-turbo，優化了應用場景、檢索增強生成、受限生成和推理任務

大型語言模型

Transformers 支持多種語言

Cadet-Tiny是一個基於SODA數據集訓練的超小型對話模型，專為邊緣設備推理設計，體積僅為Cosmo-3B模型的2%左右。

Transformers 英語

Roberta Base Chinese Extractive Qa

基於RoBERTa架構的中文抽取式問答模型，適用於從給定文本中提取答案的任務。

問答系統中文

AIbase

智啟未來，您的人工智能解決方案智庫

English 简体中文繁體中文にほんご

© 2025AIbase