RAG优化

# RAG优化

Japanese Reranker Xsmall V2

这是一个非常小巧且快速的日语重排序模型，适用于提升RAG系统的精度。

文本嵌入日语

Fine Tuned Movie Retriever Bge Base En V1.5

专为电影和电视剧推荐系统定制的微调句子转换器模型，优化了RAG管道中的高质量向量检索。

Nomic Embed Code GGUF

Nomic代码嵌入模型是一款顶尖的代码检索工具，支持多种编程语言，擅长代码检索任务。

Chonky Modernbert Large 1

Chonky是一款能够智能地将文本分割成有意义的语义块的Transformer模型，适用于RAG系统。

Transformers 英语

这是一个经过微调的sentence-transformers模型，专为金融文档检索任务优化，同时保持通用性能。

文本嵌入其他

Chonky Modernbert Base 1

Chonky是一款能智能将文本分割成有意义语义块的Transformer模型，可用于RAG系统。

Transformers 英语

Chonky Distilbert Base Uncased 1

Chonky是一款能够智能地将文本分割成有意义的语义块的Transformer模型，适用于RAG系统。

Transformers 英语

Nomic Embed Multimodal 7b

70亿参数的多模态嵌入模型，专精于视觉文档检索任务，在Vidore-v2基准测试中表现卓越

文本生成图像支持多种语言

Embedder Collection

德语和英语的多语言嵌入模型，支持8192令牌的上下文长度

文本嵌入支持多种语言

Bert Chunker Chinese 2

基于BertForTokenClassification构建的中文文本分块工具，特别适用于处理非结构化杂乱文本

序列标注支持多种语言

Granite Question Classifier

基于 IBM Granite 嵌入模型微调的问题分类器，用于区分通用问题和定向问题

Transformers 支持多种语言

基于BERT的文本分块器，通过分类器头部预测分块的起始标记，采用滑动窗口技术处理任意长度文档，适用于结构化和非结构化文本。

Safetensors 支持多种语言

ARA Reranker V1

专为阿拉伯语重排序任务设计的模型，能精准处理查询与段落的关系，直接评估问题与文档之间的相似性，输出相关性分数。

Transformers 阿拉伯语

Omartificial-Intelligence-Space

Pathumma Llm Text 1.0.0

PathummaLLM-text-1.0.0-7B 是一个支持泰语、中文和英语的70亿参数大语言模型，基于OpenThaiLLM-Prebuilt进行指令微调，优化了RAG、约束生成和推理任务。

大型语言模型

PyTorch 支持多种语言

Halong Embedding

专注于RAG（检索增强生成）和生产效率的越南语文本嵌入模型，基于intfloat/multilingual-e5-base微调

文本嵌入支持多种语言

Phi 3 Context Obedient RAG

基于microsoft/Phi-3-mini-128k-instruct优化的模型，专注于提升上下文遵循能力和减少幻觉现象，适用于RAG应用场景。

大型语言模型

Finance Embeddings Investopedia

这是FinLang团队为金融应用开发的Investopedia嵌入模型，基于BAAI/bge-base-en-v1.5微调，可将句子和段落映射到768维稠密向量空间，适用于金融领域的语义搜索等任务。

Text2vec Base Chinese Rag

专为中文文本语义理解设计的CoSENT框架模型，适用于检索增强生成(RAG)任务

Bce Embedding Base V1

BCEmbedding是网易有道研发的双语跨语言嵌入模型库，包含EmbeddingModel（语义向量生成）和RerankerModel（结果精排）两类模型。作为有道检索增强生成（RAG）系统的核心组件，已成功应用于开源项目QAnything及有道速读、有道翻译等产品。

Transformers 支持多种语言

基于BAAI/bge-reranker-large针对韩语数据进行微调的Reranker模型，用于提升韩语检索增强生成(RAG)性能

Transformers 支持多种语言

Loquace 7B Mistral

Loquace是一个会说意大利语、经过指令微调的大语言模型，旨在推动AI和LLM在意大利的民主化。

大型语言模型

Transformers 其他

Inkbot 13B 8k 0.2

Inkbot是一款专为解析和响应结构化提示而设计的对话式AI模型，支持含上下文和无上下文的动态对话。

大型语言模型

精选推荐AI模型

Llama 3 Typhoon V1.5x 8b Instruct

专为泰语设计的80亿参数指令模型，性能媲美GPT-3.5-turbo，优化了应用场景、检索增强生成、受限生成和推理任务

大型语言模型

Transformers 支持多种语言

Cadet-Tiny是一个基于SODA数据集训练的超小型对话模型，专为边缘设备推理设计，体积仅为Cosmo-3B模型的2%左右。

Transformers 英语

Roberta Base Chinese Extractive Qa

基于RoBERTa架构的中文抽取式问答模型，适用于从给定文本中提取答案的任务。

问答系统中文

AIbase

智启未来，您的人工智能解决方案智库

English 简体中文繁體中文にほんご

© 2025AIbase