🚀 cupidon - mini - ro量化模型
本項目提供了cupidon - mini - ro
模型的靜態量化版本,可用於句子嵌入、特徵提取和句子相似度計算等任務。
🚀 快速開始
如果你不確定如何使用GGUF文件,請參考TheBloke的README以獲取更多詳細信息,包括如何拼接多部分文件。
📚 詳細文檔
模型信息
屬性 |
詳情 |
基礎模型 |
BlackKakapo/cupidon - mini - ro |
數據集 |
BlackKakapo/RoSTSC |
語言 |
羅馬尼亞語(ro) |
庫名稱 |
transformers |
許可證 |
apache - 2.0 |
量化者 |
mradermacher |
標籤 |
sentence - transformers、feature - extraction、sentence - similarity、transformers |
關於量化版本
此為https://huggingface.co/BlackKakapo/cupidon - mini - ro的靜態量化版本。加權/矩陣量化文件可在https://huggingface.co/mradermacher/cupidon - mini - ro - i1 - GGUF獲取。
提供的量化文件
(按大小排序,不一定按質量排序。IQ量化通常比類似大小的非IQ量化更可取)
鏈接 |
類型 |
大小/GB |
備註 |
[GGUF](https://huggingface.co/mradermacher/cupidon - mini - ro - GGUF/resolve/main/cupidon - mini - ro.Q2_K.gguf) |
Q2_K |
0.1 |
|
[GGUF](https://huggingface.co/mradermacher/cupidon - mini - ro - GGUF/resolve/main/cupidon - mini - ro.Q3_K_S.gguf) |
Q3_K_S |
0.1 |
|
[GGUF](https://huggingface.co/mradermacher/cupidon - mini - ro - GGUF/resolve/main/cupidon - mini - ro.IQ4_XS.gguf) |
IQ4_XS |
0.1 |
|
[GGUF](https://huggingface.co/mradermacher/cupidon - mini - ro - GGUF/resolve/main/cupidon - mini - ro.Q3_K_M.gguf) |
Q3_K_M |
0.1 |
質量較低 |
[GGUF](https://huggingface.co/mradermacher/cupidon - mini - ro - GGUF/resolve/main/cupidon - mini - ro.Q3_K_L.gguf) |
Q3_K_L |
0.1 |
|
[GGUF](https://huggingface.co/mradermacher/cupidon - mini - ro - GGUF/resolve/main/cupidon - mini - ro.Q4_K_S.gguf) |
Q4_K_S |
0.1 |
快速,推薦 |
[GGUF](https://huggingface.co/mradermacher/cupidon - mini - ro - GGUF/resolve/main/cupidon - mini - ro.Q4_K_M.gguf) |
Q4_K_M |
0.1 |
快速,推薦 |
[GGUF](https://huggingface.co/mradermacher/cupidon - mini - ro - GGUF/resolve/main/cupidon - mini - ro.Q5_K_S.gguf) |
Q5_K_S |
0.1 |
|
[GGUF](https://huggingface.co/mradermacher/cupidon - mini - ro - GGUF/resolve/main/cupidon - mini - ro.Q5_K_M.gguf) |
Q5_K_M |
0.1 |
|
[GGUF](https://huggingface.co/mradermacher/cupidon - mini - ro - GGUF/resolve/main/cupidon - mini - ro.Q6_K.gguf) |
Q6_K |
0.1 |
質量非常好 |
[GGUF](https://huggingface.co/mradermacher/cupidon - mini - ro - GGUF/resolve/main/cupidon - mini - ro.Q8_0.gguf) |
Q8_0 |
0.1 |
快速,質量最佳 |
[GGUF](https://huggingface.co/mradermacher/cupidon - mini - ro - GGUF/resolve/main/cupidon - mini - ro.f16.gguf) |
f16 |
0.1 |
16 bpw,過度配置 |
以下是ikawrakow提供的比較一些低質量量化類型的便捷圖表(值越低越好):

此外,Artefact2對此事的看法可參考:https://gist.github.com/Artefact2/b5f810600771265fc1e39442288e8ec9
常見問題解答/模型請求
有關你可能遇到的問題的答案,以及如果你希望對其他模型進行量化,請訪問https://huggingface.co/mradermacher/model_requests。
📄 許可證
本項目採用apache - 2.0許可證。
🙏 致謝
感謝我的公司nethype GmbH,允許我使用其服務器,並對我的工作站進行升級,使我能夠在業餘時間完成這項工作。