BGE M3 Ko Gguf
BGE-m3-ko是基於韓語和英語優化的多語言嵌入模型,專注於高效語義檢索任務。
下載量 76
發布時間 : 11/10/2024
模型概述
該模型針對韓語和英語文本的語義相似度計算進行了優化,適用於跨語言文檔檢索、問答系統等場景。支持8位量化(q8)版本以提升推理效率。
模型特點
韓語優化
專門針對韓語文本語義理解進行優化,在韓語檢索任務中表現優異
跨語言支持
同時支持韓語和英語的語義理解與跨語言檢索
高效量化
提供8位量化版本(q8),在保持精度的同時提升推理速度
模型能力
語義相似度計算
跨語言文檔檢索
多語言文本嵌入
語義搜索
使用案例
信息檢索
跨語言文檔搜索
在韓語和英語混合文檔庫中實現精準的語義檢索
如示例所示,能準確識別不同語言間的語義關聯
問答系統
多語言FAQ檢索
根據用戶問題自動匹配最相關的多語言常見問題解答
🚀 bge-m3-ko (q8) 模型介紹
本項目展示了 bge-m3-ko (q8)
和 bge-m3 (q8)
模型在不同查詢下的文檔匹配情況,有助於瞭解模型在語義理解和文本匹配方面的性能。
🚀 快速開始
你可以通過以下鏈接訪問相關模型:https://huggingface.co/dragonkue/BGE-m3-ko
💻 使用示例
基礎用法
以下是 bge-m3-ko (q8)
模型的使用示例:
Query: 人工智能的發展可能性
Top 1 Document: 人工智能由包括機器學習和深度學習在內的多種技術組成,可能會給未來產業帶來巨大變化。, Similarity: 0.5241
Top 2 Document: 人工智能可以在醫療、金融、教育等多個領域得到應用。, Similarity: 0.5146
Top 3 Document: 宇宙探索技術每年都在發展,未來人類在火星居住的可能性也在研究中。, Similarity: 0.4594
Query: 氣候變化的原因
Top 1 Document: 氣候變化主要是由於化石燃料的使用和溫室氣體排放導致的。, Similarity: 0.6538
Top 2 Document: 全球變暖正在引發全球範圍內的異常氣候,並可能導致海平面上升。, Similarity: 0.4842
Top 3 Document: 電動汽車沒有排放氣體,維護成本低且環保。, Similarity: 0.2838
Query: 韓國的傳統文化
Top 1 Document: 韓國傳統音樂以其獨特的旋律和節奏表達了韓國人的情感。, Similarity: 0.5518
Top 2 Document: 韓服作為韓國傳統文化之一,以其美麗的色彩和獨特的設計而聞名。, Similarity: 0.5095
Top 3 Document: 語言學習對大腦發育有積極影響,並能提高對不同文化的理解。, Similarity: 0.2324
Query: 體育與健康的關係
Top 1 Document: 體育不僅對身體健康有積極影響,對心理健康也有積極影響。, Similarity: 0.6355
Top 2 Document: 運動在改善心血管健康和幫助控制體重方面起著重要作用。, Similarity: 0.4977
Top 3 Document: 飲食習慣對健康的影響非常大,攝入足夠的水果和蔬菜很重要。, Similarity: 0.4412
Query: 互聯網安全的重要性
Top 1 Document: 互聯網安全對於保護個人信息和維護數據完整性非常重要。, Similarity: 0.7541
Top 2 Document: 隨著技術的發展,網絡犯罪在增加,因此需要相應的安全解決方案。, Similarity: 0.4229
Top 3 Document: 英語學習對於提高在國際社會中的溝通能力至關重要。, Similarity: 0.3956
Query: 電動汽車的優點
Top 1 Document: 電動汽車沒有排放氣體,維護成本低且環保。, Similarity: 0.6241
Top 2 Document: 電動汽車是一種環保的交通工具,電池技術的發展被視為關鍵課題。, Similarity: 0.5373
Top 3 Document: 體育不僅對身體健康有積極影響,對心理健康也有積極影響。, Similarity: 0.2967
Query: 宇宙的奧秘
Top 1 Document: 宇宙仍有很多未知領域,科學家們正在通過各種探索來研究宇宙。, Similarity: 0.4566
Top 2 Document: 宇宙探索技術每年都在發展,未來人類在火星居住的可能性也在研究中。, Similarity: 0.3448
Top 3 Document: 韓服作為韓國傳統文化之一,以其美麗的色彩和獨特的設計而聞名。, Similarity: 0.1952
Query: 經濟衰退的影響
Top 1 Document: 經濟衰退會帶來失業率上升、消費減少等諸多負面影響。, Similarity: 0.6880
Top 2 Document: 經濟衰退不僅對個人消費有很大影響,對政府預算也有很大影響。, Similarity: 0.6336
Top 3 Document: 語言學習對大腦發育有積極影響,並能提高對不同文化的理解。, Similarity: 0.2812
Query: 語言學習的好處
Top 1 Document: 語言學習對大腦發育有積極影響,並能提高對不同文化的理解。, Similarity: 0.6698
Top 2 Document: 英語學習對於提高在國際社會中的溝通能力至關重要。, Similarity: 0.5146
Top 3 Document: 體育不僅對身體健康有積極影響,對心理健康也有積極影響。, Similarity: 0.3503
Query: 食物與健康的關係
Top 1 Document: 飲食習慣對健康的影響非常大,攝入足夠的水果和蔬菜很重要。, Similarity: 0.5472
Top 2 Document: 健康的飲食習慣不僅有助於控制體重,還有助於預防心臟病。, Similarity: 0.4747
Top 3 Document: 運動在改善心血管健康和幫助控制體重方面起著重要作用。, Similarity: 0.4137
高級用法
以下是 bge-m3 (q8)
模型的使用示例:
Query: 人工智能的發展可能性
Top 1 Document: 人工智能由包括機器學習和深度學習在內的多種技術組成,可能會給未來產業帶來巨大變化。, Similarity: 0.6328
Top 2 Document: 人工智能可以在醫療、金融、教育等多個領域得到應用。, Similarity: 0.6251
Top 3 Document: 宇宙探索技術每年都在發展,未來人類在火星居住的可能性也在研究中。, Similarity: 0.5584
Query: 氣候變化的原因
Top 1 Document: 氣候變化主要是由於化石燃料的使用和溫室氣體排放導致的。, Similarity: 0.7124
Top 2 Document: 全球變暖正在引發全球範圍內的異常氣候,並可能導致海平面上升。, Similarity: 0.5879
Top 3 Document: 經濟衰退會帶來失業率上升、消費減少等諸多負面影響。, Similarity: 0.4139
Query: 韓國的傳統文化
Top 1 Document: 韓國傳統音樂以其獨特的旋律和節奏表達了韓國人的情感。, Similarity: 0.5997
Top 2 Document: 韓服作為韓國傳統文化之一,以其美麗的色彩和獨特的設計而聞名。, Similarity: 0.5613
Top 3 Document: 語言學習對大腦發育有積極影響,並能提高對不同文化的理解。, Similarity: 0.3569
Query: 體育與健康的關係
Top 1 Document: 體育不僅對身體健康有積極影響,對心理健康也有積極影響。, Similarity: 0.7291
Top 2 Document: 運動在改善心血管健康和幫助控制體重方面起著重要作用。, Similarity: 0.6079
Top 3 Document: 飲食習慣對健康的影響非常大,攝入足夠的水果和蔬菜很重要。, Similarity: 0.5406
Query: 互聯網安全的重要性
Top 1 Document: 互聯網安全對於保護個人信息和維護數據完整性非常重要。, Similarity: 0.8048
Top 2 Document: 隨著技術的發展,網絡犯罪在增加,因此需要相應的安全解決方案。, Similarity: 0.5497
Top 3 Document: 英語學習對於提高在國際社會中的溝通能力至關重要。, Similarity: 0.5284
Query: 電動汽車的優點
Top 1 Document: 電動汽車沒有排放氣體,維護成本低且環保。, Similarity: 0.7034
Top 2 Document: 電動汽車是一種環保的交通工具,電池技術的發展被視為關鍵課題。, Similarity: 0.6295
Top 3 Document: 體育不僅對身體健康有積極影響,對心理健康也有積極影響。, Similarity: 0.4598
Query: 宇宙的奧秘
Top 1 Document: 宇宙仍有很多未知領域,科學家們正在通過各種探索來研究宇宙。, Similarity: 0.5024
Top 2 Document: 宇宙探索技術每年都在發展,未來人類在火星居住的可能性也在研究中。, Similarity: 0.4037
Top 3 Document: 語言學習對大腦發育有積極影響,並能提高對不同文化的理解。, Similarity: 0.3090
Query: 經濟衰退的影響
Top 1 Document: 經濟衰退會帶來失業率上升、消費減少等諸多負面影響。, Similarity: 0.7642
Top 2 Document: 經濟衰退不僅對個人消費有很大影響,對政府預算也有很大影響。, Similarity: 0.7213
Top 3 Document: 語言學習對大腦發育有積極影響,並能提高對不同文化的理解。, Similarity: 0.4467
Query: 語言學習的好處
Top 1 Document: 語言學習對大腦發育有積極影響,並能提高對不同文化的理解。, Similarity: 0.7626
Top 2 Document: 英語學習對於提高在國際社會中的溝通能力至關重要。, Similarity: 0.6351
Top 3 Document: 體育不僅對身體健康有積極影響,對心理健康也有積極影響。, Similarity: 0.5184
Query: 食物與健康的關係
Top 1 Document: 飲食習慣對健康的影響非常大,攝入足夠的水果和蔬菜很重要。, Similarity: 0.6330
Top 2 Document: 健康的飲食習慣不僅有助於控制體重,還有助於預防心臟病。, Similarity: 0.5846
Top 3 Document: 運動在改善心血管健康和幫助控制體重方面起著重要作用。, Similarity: 0.5408
📄 許可證
本項目採用 Apache-2.0
許可證。
Jina Embeddings V3
Jina Embeddings V3 是一個多語言句子嵌入模型,支持超過100種語言,專注於句子相似度和特徵提取任務。
文本嵌入
Transformers 支持多種語言

J
jinaai
3.7M
911
Ms Marco MiniLM L6 V2
Apache-2.0
基於MS Marco段落排序任務訓練的交叉編碼器模型,用於信息檢索中的查詢-段落相關性評分
文本嵌入 英語
M
cross-encoder
2.5M
86
Opensearch Neural Sparse Encoding Doc V2 Distill
Apache-2.0
基於蒸餾技術的稀疏檢索模型,專為OpenSearch優化,支持免推理文檔編碼,在搜索相關性和效率上優於V1版本
文本嵌入
Transformers 英語

O
opensearch-project
1.8M
7
Sapbert From PubMedBERT Fulltext
Apache-2.0
基於PubMedBERT的生物醫學實體表徵模型,通過自對齊預訓練優化語義關係捕捉
文本嵌入 英語
S
cambridgeltl
1.7M
49
Gte Large
MIT
GTE-Large 是一個強大的句子轉換器模型,專注於句子相似度和文本嵌入任務,在多個基準測試中表現出色。
文本嵌入 英語
G
thenlper
1.5M
278
Gte Base En V1.5
Apache-2.0
GTE-base-en-v1.5 是一個英文句子轉換器模型,專注於句子相似度任務,在多個文本嵌入基準測試中表現優異。
文本嵌入
Transformers 支持多種語言

G
Alibaba-NLP
1.5M
63
Gte Multilingual Base
Apache-2.0
GTE Multilingual Base 是一個多語言的句子嵌入模型,支持超過50種語言,適用於句子相似度計算等任務。
文本嵌入
Transformers 支持多種語言

G
Alibaba-NLP
1.2M
246
Polybert
polyBERT是一個化學語言模型,旨在實現完全由機器驅動的超快聚合物信息學。它將PSMILES字符串映射為600維密集指紋,以數值形式表示聚合物化學結構。
文本嵌入
Transformers

P
kuelumbus
1.0M
5
Bert Base Turkish Cased Mean Nli Stsb Tr
Apache-2.0
基於土耳其語BERT的句子嵌入模型,專為語義相似度任務優化
文本嵌入
Transformers 其他

B
emrecan
1.0M
40
GIST Small Embedding V0
MIT
基於BAAI/bge-small-en-v1.5模型微調的文本嵌入模型,通過MEDI數據集與MTEB分類任務數據集訓練,優化了檢索任務的查詢編碼能力。
文本嵌入
Safetensors 英語
G
avsolatorio
945.68k
29
精選推薦AI模型
Llama 3 Typhoon V1.5x 8b Instruct
專為泰語設計的80億參數指令模型,性能媲美GPT-3.5-turbo,優化了應用場景、檢索增強生成、受限生成和推理任務
大型語言模型
Transformers 支持多種語言

L
scb10x
3,269
16
Cadet Tiny
Openrail
Cadet-Tiny是一個基於SODA數據集訓練的超小型對話模型,專為邊緣設備推理設計,體積僅為Cosmo-3B模型的2%左右。
對話系統
Transformers 英語

C
ToddGoldfarb
2,691
6
Roberta Base Chinese Extractive Qa
基於RoBERTa架構的中文抽取式問答模型,適用於從給定文本中提取答案的任務。
問答系統 中文
R
uer
2,694
98