🚀 hiieu/halong_embedding
(GGUF格式)
本項目提供了hiieu/halong_embedding
模型的GGUF格式轉換及使用方法,可用於句子相似度任務,支持越南語。
🚀 快速開始
量化步驟
可通過以下命令將模型轉換為GGUF格式並進行量化:
REL=b3827
wget https://github.com/ggerganov/llama.cpp/releases/download/$REL/llama-$REL-bin-ubuntu-x64.zip --content-disposition --continue &> /dev/null
wget https://github.com/ggerganov/llama.cpp/archive/refs/tags/$REL.zip --content-disposition --continue &> /dev/null
unzip -q llama-$REL-bin-ubuntu-x64.zip
unzip -q llama.cpp-$REL.zip
mv llama.cpp-$REL/* .
rm -r llama.cpp-$REL/ llama-$REL-bin-ubuntu-x64.zip llama.cpp-$REL.zip
pip install -q -r requirements.txt
rm -rf models/tmp/
git clone --depth=1 --single-branch https://huggingface.co/hiieu/halong_embedding models/tmp
huggingface-cli download intfloat/multilingual-e5-base sentencepiece.bpe.model --local-dir models/tmp
python convert_hf_to_gguf.py models/tmp/ --outfile model-f32.gguf --outtype f32
build/bin/llama-quantize model-f32.gguf model-f16.gguf f16 2> /dev/null
build/bin/llama-quantize model-f32.gguf model-bf16.gguf bf16 2> /dev/null
build/bin/llama-quantize model-f32.gguf model-q8_0.gguf q8_0 2> /dev/null
build/bin/llama-quantize model-f32.gguf model-q6_k.gguf q6_k 2> /dev/null
build/bin/llama-quantize model-f32.gguf model-q5_k_m.gguf q5_k_m 2> /dev/null
build/bin/llama-quantize model-f32.gguf model-q5_k_s.gguf q5_k_s 2> /dev/null
build/bin/llama-quantize model-f32.gguf model-q4_k_m.gguf q4_k_m 2> /dev/null
build/bin/llama-quantize model-f32.gguf model-q4_k_s.gguf q4_k_s 2> /dev/null
rm -rf models/yolo/
mkdir -p models/yolo
mv model-*.gguf models/yolo/
touch models/yolo/README.md
huggingface-cli upload halong-embedding-gguf models/yolo .
使用示例
基礎用法
可使用以下命令進行嵌入計算:
build/bin/llama-embedding -m model-q5_k_m.gguf -p "Cô ấy cười nói suốt cả ngày" --embd-output-format array 2> /dev/null
高級用法
可啟動服務器進行嵌入服務:
build/bin/llama-server --embedding -c 512 -m model-q5_k_m.gguf
📦 安裝指南
在執行量化和使用命令前,請確保已經完成以下依賴安裝:
pip install -q -r requirements.txt
📄 許可證
本項目採用CC BY 4.0許可證。
📚 詳細文檔
屬性 |
詳情 |
模型類型 |
句子相似度 |
訓練數據 |
未提及 |
基礎模型 |
hiieu/halong_embedding |
庫名稱 |
sentence-transformers |
許可證 |
CC BY 4.0 |