# 檢索增強生成

All MiniLM L2 V2
Apache-2.0
該模型是從all-MiniLM-L12-v2蒸餾而來,推理速度提升近2倍,同時在CPU和GPU上保持較高的準確度。
文本嵌入 支持多種語言
A
tabularisai
5,063
2
Treehop Rag
MIT
TreeHop是一個輕量級的嵌入級框架,用於高效處理多跳問答中的查詢嵌入生成與過濾,顯著降低計算開銷。
問答系統
T
allen-li1231
36
3
Qwen 2.5 7B Base RAG RL
Qwen-2.5-7B-base-RAG-RL 是一個基於未知數據集從頭開始訓練的7B參數規模的大語言模型,結合了檢索增強生成(RAG)和強化學習(RL)技術。
大型語言模型 Transformers
Q
XXsongLALA
859
7
Jina Reranker V2 Base Multilingual Wiki Tr Rag Prefix
Apache-2.0
基於jina-reranker-v2-base-multilingual微調的交叉編碼器模型,用於文本重排序和語義搜索
文本嵌入
J
SMARTICT
173
0
Pleias RAG 350M
Apache-2.0
Pleias-RAG-350M是一款3.5億參數的小型推理模型,專為檢索增強生成(RAG)、搜索和來源摘要任務而訓練。
大型語言模型 Transformers 支持多種語言
P
PleIAs
292
13
Reasonir 8B
ReasonIR-8B是首個專為通用推理任務訓練的檢索模型,在BRIGHT基準上實現了最先進的檢索性能,並在RAG應用中顯著提升了MMLU和GPQA基準的表現。
文本嵌入 Transformers 英語
R
reasonir
13.43k
39
Colnomic Embed Multimodal 3b
ColNomic Embed多模態3B是一款30億參數的多模態嵌入模型,專為視覺文檔檢索任務設計,支持多語言文本和圖像的統一編碼。
多模態融合 支持多種語言
C
nomic-ai
4,636
17
Mxbai Rerank Large V2 GGUF
Apache-2.0
本倉庫包含mixedbread-ai/mxbai-rerank-large-v2的GGUF格式模型文件,由TensorBlock提供的機器進行量化,兼容llama.cpp。
文本嵌入 支持多種語言
M
tensorblock
150
1
Bge Reranker V2 M3 Q4 K M GGUF
Apache-2.0
本模型是基於BAAI/bge-reranker-v2-m3轉換的GGUF格式模型,用於文本排序任務,支持多語言。
文本嵌入 其他
B
sabafallah
49
0
Finseer
首個專為金融時間序列預測設計的檢索器,基於檢索增強生成(RAG)框架
大型語言模型 Transformers 英語
F
TheFinAI
13
1
Stockllm
FinSeer StockLLM 是一個開源的10億參數大語言模型,專為金融時間序列預測設計,採用檢索增強生成(RAG)框架。
大型語言模型 Transformers 英語
S
TheFinAI
29
1
Gen 8B R2
Apache-2.0
Gen-8B-R2是一個專注於減少RAG系統中幻覺問題的生成模型,特別適用於處理檢索噪聲和信息過載的情況。
大型語言模型 Transformers 英語
G
DISLab
34
2
C4ai Command A 03 2025
Cohere Labs Command A 是一個開放權重的1110億參數模型研究版本,專為需要快速、安全且高質量AI的嚴苛企業需求優化。
大型語言模型 Transformers 支持多種語言
C
CohereLabs
6,416
347
Trendyol LLM 7B Chat V4.1.0
Apache-2.0
Trendyol LLM v4.1.0 是一款基於 Trendyol LLM base v4.0(在130億token上繼續預訓練的Qwen2.5 7B版本)的生成模型,專注於電商領域和土耳其語理解。
大型語言模型 其他
T
Trendyol
854
25
Jbaron34 SmolLM2 135M Bebop Reranker Gguf
一個輕量級的文本排序模型,適用於重新排序搜索結果或文檔
J
RichardErkhov
855
0
Kanana Nano 2.1b Embedding
Kanana是由Kakao開發的雙語(韓語/英語)語言模型系列,在韓語任務上表現卓越,在英語任務上具備競爭力,相比同規模模型顯著降低計算成本。
大型語言模型 Transformers 支持多種語言
K
kakaocorp
7,722
20
Gte Qwen2 7B Instruct GGUF
Apache-2.0
阿里巴巴NLP團隊開發的7B參數規模的多語言文本嵌入模型,專注於句子相似度任務,提供多種量化版本
大型語言模型 英語
G
mradermacher
510
2
Bert Chunker 3
MIT
基於BertForTokenClassification的文本分塊器,適用於結構化和非結構化文本,特別優化用於RAG場景
序列標註 Safetensors 支持多種語言
B
tim1900
1,226
1
Pllum 12B Nc Chat
PLLuM-12B-chat是波蘭大語言模型家族中的120億參數對話優化版本,專為波蘭語及斯拉夫/波羅的海語言設計,通過指令微調和偏好學習實現安全高效的交互能力。
大型語言模型 Transformers
P
CYFRAGOVPL
2,673
6
Bge Reranker V2 M3 Q4 K M GGUF
Apache-2.0
本模型是BAAI/bge-reranker-v2-m3的GGUF量化版本,用於文本重排序任務,支持多語言。
文本嵌入 其他
B
sikreutz
46
1
Fluxi AI Small Vision
Apache-2.0
Fluxi AI 是一款基於 Qwen2-VL-7B-Instruct 的多模態智能助手,具備文本、圖像和視頻處理能力,特別優化了葡萄牙語支持。
圖像生成文本 Transformers 其他
F
JJhooww
25
2
Jina Embeddings GGUF
Apache-2.0
Jina Embeddings V2 Base 是一個高效的英文句子嵌入模型,專注於句子相似度和特徵提取任務。
文本嵌入 英語
J
narainp
139
1
Lb Reranker 0.5B V1.0
Apache-2.0
LB重排序器是用於判斷查詢與文本片段相關性的模型,支持95+種語言,適用於檢索任務中的排序和重排序。
大型語言模型 Transformers 支持多種語言
L
lightblue
917
66
Granite 3.1 3b A800m Instruct
Apache-2.0
基於Granite-3.1-3B-A800M-Base微調的30億參數長上下文指令模型,支持多語言任務
大型語言模型 Transformers
G
ibm-granite
36.16k
24
Ruri Base V2
Apache-2.0
Ruri是一個針對日語優化的通用文本嵌入模型,基於Sentence Transformers架構,特別設計用於句子相似度計算和特徵提取任務。
文本嵌入 日語
R
cl-nagoya
12.77k
4
Llama3.1 8B Legal ThaiCCL Combine
Llama-3.1-Legal-ThaiCCL-8B 是基於 Llama-3.1-8B 構建的大語言模型,專門用於回答泰語法律問題。
大型語言模型 Transformers
L
airesearch
1,813
2
GATE Reranker V1
Apache-2.0
專為阿拉伯語文檔檢索與排序優化的高性能重排序模型
文本嵌入 Transformers 阿拉伯語
G
NAMAA-Space
615
7
Bge Reranker V2 M3 Q4 K M GGUF
Apache-2.0
該模型是從BAAI/bge-reranker-v2-m3轉換而來的GGUF格式模型,用於文本重排序任務,支持多語言。
文本嵌入 其他
B
puppyM
83
1
Vikhr Nemo 12B Instruct R 21 09 24
Apache-2.0
Vikhr-Nemo是基於Mistral-Nemo-Instruct-2407優化的雙語大語言模型,專為俄語和英語優化,支持邏輯推理、文本摘要、代碼生成等多種任務。
大型語言模型 Transformers 支持多種語言
V
Vikhrmodels
3,707
118
Bge Reranker V2 Gemma IQ4 NL GGUF
Apache-2.0
這是BAAI/bge-reranker-v2-gemma模型的GGUF格式轉換版本,適用於llama.cpp框架,支持多語言文本分類任務。
文本嵌入 其他
B
zimajava
20
1
Datagemma Rag 27b It
DataGemma是基於Gemma 2微調的系列模型,專門用於幫助大語言模型訪問和整合Data Commons中的可靠公共統計數據。
大型語言模型 Transformers
D
google
691
186
Gemma 2 2b It Chinese Kyara Dpo
Kyara是一個通過知識檢索增強的語言模型微調項目,專注於提升模型在繁體中文等資源較少語言上的表現。
大型語言模型 Transformers 支持多種語言
G
zake7749
2,334
13
Llama 3 8B Instruct Finance RAG
基於Llama 3 8B Instruct微調的金融領域RAG模型,專門針對金融問答場景優化
大型語言模型 Transformers 英語
L
curiousily
1,850
16
Command R
C4AI Command - R是一款擁有350億參數的高性能生成模型的研究版本,針對推理、總結和問答等多種用例進行了優化。
大型語言模型
C
cortexso
748
2
Gte Qwen2 7B Instruct
Apache-2.0
基於Qwen2架構的7B參數規模的大語言模型,專注於句子相似度計算和文本嵌入任務。
大型語言模型 Transformers
G
Alibaba-NLP
169.82k
398
Phi3 Rag Relevance Judge Merge
一個用於判斷參考文本與問題相關性的二元分類模型,專為RAG系統優化
大型語言模型 Transformers
P
grounded-ai
21
1
Llama 3 Typhoon V1.5x 8b Instruct
專為泰語設計的80億參數指令模型,性能媲美GPT-3.5-turbo,優化了應用場景、檢索增強生成、受限生成和推理任務
大型語言模型 Transformers 支持多種語言
L
scb10x
3,269
16
Llm2vec Meta Llama 3 8B Instruct Mntp
MIT
LLM2Vec是將僅解碼器架構的大語言模型轉化為文本編碼器的簡易方案,通過啟用雙向注意力機制、掩碼下一詞預測和無監督對比學習實現。
文本嵌入 Transformers 英語
L
McGill-NLP
3,885
16
Llama3 ChatQA 1.5 70B
Llama3-ChatQA-1.5是基於Llama-3基礎模型開發的對話式問答和檢索增強生成模型,在對話式QA和RAG任務中表現卓越。
大型語言模型 Transformers 英語
L
nvidia
205
333
Gte Base En V1.5
Apache-2.0
GTE-base-en-v1.5 是一個英文句子轉換器模型,專注於句子相似度任務,在多個文本嵌入基準測試中表現優異。
文本嵌入 Transformers 支持多種語言
G
Alibaba-NLP
1.5M
63
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase