🚀 多語言-e5-large-instruct-Q3_K_S-GGUF模型
本模型是通過llama.cpp,藉助ggml.ai的GGUF-my-repo空間,從intfloat/multilingual-e5-large-instruct
轉換為GGUF格式的。有關該模型的更多詳細信息,請參考原始模型卡片。
🚀 快速開始
✨ 主要特性
- 支持多語言,涵蓋了眾多語言類型,如英語、中文、日語等。
- 基於
intfloat/multilingual-e5-large-instruct
模型轉換而來,保留了原模型的核心能力。
- 以GGUF格式呈現,便於與llama.cpp進行集成使用。
📦 安裝指南
通過Homebrew(適用於Mac和Linux)安裝llama.cpp:
brew install llama.cpp
💻 使用示例
基礎用法
使用llama.cpp的命令行界面(CLI)進行推理:
llama-cli --hf-repo yoeven/multilingual-e5-large-instruct-Q3_K_S-GGUF --hf-file multilingual-e5-large-instruct-q3_k_s.gguf -p "The meaning to life and the universe is"
高級用法
啟動llama.cpp服務器進行推理:
llama-server --hf-repo yoeven/multilingual-e5-large-instruct-Q3_K_S-GGUF --hf-file multilingual-e5-large-instruct-q3_k_s.gguf -c 2048
另外,你也可以按照Llama.cpp倉庫中列出的使用步驟直接使用該檢查點:
git clone https://github.com/ggerganov/llama.cpp
cd llama.cpp && LLAMA_CURL=1 make
./llama-cli --hf-repo yoeven/multilingual-e5-large-instruct-Q3_K_S-GGUF --hf-file multilingual-e5-large-instruct-q3_k_s.gguf -p "The meaning to life and the universe is"
或者
./llama-server --hf-repo yoeven/multilingual-e5-large-instruct-Q3_K_S-GGUF --hf-file multilingual-e5-large-instruct-q3_k_s.gguf -c 2048
🔧 技術細節
本模型基於intfloat/multilingual-e5-large-instruct
基礎模型,通過llama.cpp和ggml.ai的GGUF-my-repo空間轉換為GGUF格式。GGUF格式是一種高效的模型存儲和使用格式,能夠與llama.cpp很好地集成,提供了命令行界面和服務器兩種使用方式,方便用戶根據不同的場景進行推理操作。
📄 許可證
本模型遵循MIT許可證。
模型信息表格
屬性 |
詳情 |
模型類型 |
基於intfloat/multilingual-e5-large-instruct 轉換的GGUF格式模型 |
訓練數據 |
參考原始模型的訓練數據 |
模型評估結果
本模型在多個數據集上進行了評估,涵蓋了分類、檢索、聚類、重排序等多種任務,以下是部分評估結果展示:
分類任務
數據集名稱 |
準確率 |
AP |
F1 |
MTEB AmazonCounterfactualClassification (en) |
76.23880597014924 |
39.07351965022687 |
70.04836733862683 |
MTEB AmazonPolarityClassification |
96.28742500000001 |
94.8449918887462 |
96.28680923610432 |
MTEB AmazonReviewsClassification (en) |
56.716 |
- |
55.76510398266401 |
... |
... |
... |
... |
檢索任務
數據集名稱 |
MAP@1 |
MAP@10 |
MAP@100 |
... |
MTEB ArguAna |
31.721 |
49.221 |
49.884 |
... |
MTEB CQADupstackRetrieval |
27.764166666666668 |
37.298166666666674 |
38.530166666666666 |
... |
... |
... |
... |
... |
... |
聚類任務
數據集名稱 |
V-measure |
MTEB ArxivClusteringP2P |
46.40419580759799 |
MTEB ArxivClusteringS2S |
40.48593255007969 |
... |
... |
重排序任務
數據集名稱 |
MAP |
MRR |
MTEB AskUbuntuDupQuestions |
63.889179122289995 |
77.61146286769556 |
MTEB MindSmallReranking |
33.08507884504006 |
34.32436977159129 |
... |
... |
... |
語義文本相似度任務(STS)
數據集名稱 |
Cosine相似度 - Pearson |
Cosine相似度 - Spearman |
... |
MTEB BIOSSES |
88.15075203727929 |
86.9622224570873 |
... |
MTEB SICK-R |
85.84209174935282 |
81.73248048438833 |
... |
... |
... |
... |
... |
雙語挖掘任務
數據集名稱 |
準確率 |
F1 |
精確率 |
召回率 |
MTEB BUCC (de-en) |
99.65553235908142 |
99.60681976339595 |
99.58246346555325 |
99.65553235908142 |
MTEB BUCC (fr-en) |
99.26260180497468 |
99.14520507740848 |
99.08650671362535 |
99.26260180497468 |
... |
... |
... |
... |
... |
以上僅展示了部分評估結果,完整結果可參考文檔開頭的詳細數據部分。這些結果展示了模型在不同任務和數據集上的性能表現,為用戶瞭解模型能力提供了參考。