Japanese Reranker Xsmall V2
MIT
這是一個非常小巧且快速的日語重排序模型,適用於提升RAG系統的精度。
文本嵌入 日語
J
hotchpotch
260
1
Fine Tuned Movie Retriever Bge Base En V1.5
Apache-2.0
專為電影和電視劇推薦系統定製的微調句子轉換器模型,優化了RAG管道中的高質量向量檢索。
文本嵌入
F
JJTsao
540
1
Nomic Embed Code GGUF
Apache-2.0
Nomic代碼嵌入模型是一款頂尖的代碼檢索工具,支持多種編程語言,擅長代碼檢索任務。
文本嵌入
N
nomic-ai
1,300
4
Chonky Modernbert Large 1
MIT
Chonky是一款能夠智能地將文本分割成有意義的語義塊的Transformer模型,適用於RAG系統。
序列標註
Transformers 英語

C
mirth
54
2
Fin Mpnet Base
這是一個經過微調的sentence-transformers模型,專為金融文檔檢索任務優化,同時保持通用性能。
文本嵌入 其他
F
mukaj
131.16k
7
Chonky Modernbert Base 1
MIT
Chonky是一款能智能將文本分割成有意義語義塊的Transformer模型,可用於RAG系統。
序列標註
Transformers 英語

C
mirth
221
1
Chonky Distilbert Base Uncased 1
MIT
Chonky是一款能夠智能地將文本分割成有意義的語義塊的Transformer模型,適用於RAG系統。
序列標註
Transformers 英語

C
mirth
1,486
12
Nomic Embed Multimodal 7b
Apache-2.0
70億參數的多模態嵌入模型,專精於視覺文檔檢索任務,在Vidore-v2基準測試中表現卓越
文本生成圖像 支持多種語言
N
nomic-ai
741
26
Embedder Collection
德語和英語的多語言嵌入模型,支持8192令牌的上下文長度
文本嵌入 支持多種語言
E
kalle07
6,623
10
Bert Chunker Chinese 2
MIT
基於BertForTokenClassification構建的中文文本分塊工具,特別適用於處理非結構化雜亂文本
序列標註 支持多種語言
B
tim1900
41
1
Granite Question Classifier
MIT
基於 IBM Granite 嵌入模型微調的問題分類器,用於區分通用問題和定向問題
文本分類
Transformers 支持多種語言

G
cnmoro
22
2
Bert Chunker 2
Apache-2.0
基於BERT的文本分塊器,通過分類器頭部預測分塊的起始標記,採用滑動窗口技術處理任意長度文檔,適用於結構化和非結構化文本。
序列標註
Safetensors 支持多種語言
B
tim1900
81
1
ARA Reranker V1
Apache-2.0
專為阿拉伯語重排序任務設計的模型,能精準處理查詢與段落的關係,直接評估問題與文檔之間的相似性,輸出相關性分數。
文本嵌入
Transformers 阿拉伯語

A
Omartificial-Intelligence-Space
795
3
Pathumma Llm Text 1.0.0
Apache-2.0
PathummaLLM-text-1.0.0-7B 是一個支持泰語、中文和英語的70億參數大語言模型,基於OpenThaiLLM-Prebuilt進行指令微調,優化了RAG、約束生成和推理任務。
大型語言模型
PyTorch 支持多種語言
P
nectec
2,362
10
Halong Embedding
Apache-2.0
專注於RAG(檢索增強生成)和生產效率的越南語文本嵌入模型,基於intfloat/multilingual-e5-base微調
文本嵌入 支持多種語言
H
hiieu
7,651
29
Phi 3 Context Obedient RAG
基於microsoft/Phi-3-mini-128k-instruct優化的模型,專注於提升上下文遵循能力和減少幻覺現象,適用於RAG應用場景。
大型語言模型
Transformers

P
TroyDoesAI
19
28
Finance Embeddings Investopedia
這是FinLang團隊為金融應用開發的Investopedia嵌入模型,基於BAAI/bge-base-en-v1.5微調,可將句子和段落映射到768維稠密向量空間,適用於金融領域的語義搜索等任務。
文本嵌入
F
FinLang
21.25k
32
Text2vec Base Chinese Rag
Apache-2.0
專為中文文本語義理解設計的CoSENT框架模型,適用於檢索增強生成(RAG)任務
文本嵌入
Transformers

T
Mike0307
46.60k
9
Bce Embedding Base V1
Apache-2.0
BCEmbedding是網易有道研發的雙語跨語言嵌入模型庫,包含EmbeddingModel(語義向量生成)和RerankerModel(結果精排)兩類模型。作為有道檢索增強生成(RAG)系統的核心組件,已成功應用於開源項目QAnything及有道速讀、有道翻譯等產品。
文本嵌入
Transformers 支持多種語言

B
maidalun1020
69.82k
375
Ko Reranker
MIT
基於BAAI/bge-reranker-large針對韓語數據進行微調的Reranker模型,用於提升韓語檢索增強生成(RAG)性能
文本嵌入
Transformers 支持多種語言

K
Dongjin-kr
34.08k
59
Loquace 7B Mistral
Apache-2.0
Loquace是一個會說意大利語、經過指令微調的大語言模型,旨在推動AI和LLM在意大利的民主化。
大型語言模型
Transformers 其他

L
cosimoiaia
17
15
Inkbot 13B 8k 0.2
Inkbot是一款專為解析和響應結構化提示而設計的對話式AI模型,支持含上下文和無上下文的動態對話。
大型語言模型
Transformers

I
Tostino
32
68
精選推薦AI模型
Llama 3 Typhoon V1.5x 8b Instruct
專為泰語設計的80億參數指令模型,性能媲美GPT-3.5-turbo,優化了應用場景、檢索增強生成、受限生成和推理任務
大型語言模型
Transformers 支持多種語言

L
scb10x
3,269
16
Cadet Tiny
Openrail
Cadet-Tiny是一個基於SODA數據集訓練的超小型對話模型,專為邊緣設備推理設計,體積僅為Cosmo-3B模型的2%左右。
對話系統
Transformers 英語

C
ToddGoldfarb
2,691
6
Roberta Base Chinese Extractive Qa
基於RoBERTa架構的中文抽取式問答模型,適用於從給定文本中提取答案的任務。
問答系統 中文
R
uer
2,694
98