RAG優化

# RAG優化

Japanese Reranker Xsmall V2

這是一個非常小巧且快速的日語重排序模型，適用於提升RAG系統的精度。

文本嵌入日語

Fine Tuned Movie Retriever Bge Base En V1.5

專為電影和電視劇推薦系統定製的微調句子轉換器模型，優化了RAG管道中的高質量向量檢索。

Nomic Embed Code GGUF

Nomic代碼嵌入模型是一款頂尖的代碼檢索工具，支持多種編程語言，擅長代碼檢索任務。

Chonky Modernbert Large 1

Chonky是一款能夠智能地將文本分割成有意義的語義塊的Transformer模型，適用於RAG系統。

Transformers 英語

這是一個經過微調的sentence-transformers模型，專為金融文檔檢索任務優化，同時保持通用性能。

文本嵌入其他

Chonky Modernbert Base 1

Chonky是一款能智能將文本分割成有意義語義塊的Transformer模型，可用於RAG系統。

Transformers 英語

Chonky Distilbert Base Uncased 1

Chonky是一款能夠智能地將文本分割成有意義的語義塊的Transformer模型，適用於RAG系統。

Transformers 英語

Nomic Embed Multimodal 7b

70億參數的多模態嵌入模型，專精於視覺文檔檢索任務，在Vidore-v2基準測試中表現卓越

文本生成圖像支持多種語言

Embedder Collection

德語和英語的多語言嵌入模型，支持8192令牌的上下文長度

文本嵌入支持多種語言

Bert Chunker Chinese 2

基於BertForTokenClassification構建的中文文本分塊工具，特別適用於處理非結構化雜亂文本

序列標註支持多種語言

Granite Question Classifier

基於 IBM Granite 嵌入模型微調的問題分類器，用於區分通用問題和定向問題

Transformers 支持多種語言

基於BERT的文本分塊器，通過分類器頭部預測分塊的起始標記，採用滑動窗口技術處理任意長度文檔，適用於結構化和非結構化文本。

Safetensors 支持多種語言

ARA Reranker V1

專為阿拉伯語重排序任務設計的模型，能精準處理查詢與段落的關係，直接評估問題與文檔之間的相似性，輸出相關性分數。

Transformers 阿拉伯語

Omartificial-Intelligence-Space

Pathumma Llm Text 1.0.0

PathummaLLM-text-1.0.0-7B 是一個支持泰語、中文和英語的70億參數大語言模型，基於OpenThaiLLM-Prebuilt進行指令微調，優化了RAG、約束生成和推理任務。

大型語言模型

PyTorch 支持多種語言

Halong Embedding

專注於RAG（檢索增強生成）和生產效率的越南語文本嵌入模型，基於intfloat/multilingual-e5-base微調

文本嵌入支持多種語言

Phi 3 Context Obedient RAG

基於microsoft/Phi-3-mini-128k-instruct優化的模型，專注於提升上下文遵循能力和減少幻覺現象，適用於RAG應用場景。

大型語言模型

Finance Embeddings Investopedia

這是FinLang團隊為金融應用開發的Investopedia嵌入模型，基於BAAI/bge-base-en-v1.5微調，可將句子和段落映射到768維稠密向量空間，適用於金融領域的語義搜索等任務。

Text2vec Base Chinese Rag

專為中文文本語義理解設計的CoSENT框架模型，適用於檢索增強生成(RAG)任務

Bce Embedding Base V1

BCEmbedding是網易有道研發的雙語跨語言嵌入模型庫，包含EmbeddingModel（語義向量生成）和RerankerModel（結果精排）兩類模型。作為有道檢索增強生成（RAG）系統的核心組件，已成功應用於開源項目QAnything及有道速讀、有道翻譯等產品。

Transformers 支持多種語言

基於BAAI/bge-reranker-large針對韓語數據進行微調的Reranker模型，用於提升韓語檢索增強生成(RAG)性能

Transformers 支持多種語言

Loquace 7B Mistral

Loquace是一個會說意大利語、經過指令微調的大語言模型，旨在推動AI和LLM在意大利的民主化。

大型語言模型

Transformers 其他

Inkbot 13B 8k 0.2

Inkbot是一款專為解析和響應結構化提示而設計的對話式AI模型，支持含上下文和無上下文的動態對話。

大型語言模型

精選推薦AI模型

Llama 3 Typhoon V1.5x 8b Instruct

專為泰語設計的80億參數指令模型，性能媲美GPT-3.5-turbo，優化了應用場景、檢索增強生成、受限生成和推理任務

大型語言模型

Transformers 支持多種語言

Cadet-Tiny是一個基於SODA數據集訓練的超小型對話模型，專為邊緣設備推理設計，體積僅為Cosmo-3B模型的2%左右。

Transformers 英語

Roberta Base Chinese Extractive Qa

基於RoBERTa架構的中文抽取式問答模型，適用於從給定文本中提取答案的任務。

問答系統中文

AIbase

智啟未來，您的人工智能解決方案智庫

English 简体中文繁體中文にほんご

© 2025AIbase