🚀 hiieu/halong_embedding
(GGUF格式)
本项目提供了hiieu/halong_embedding
模型的GGUF格式转换及使用方法,可用于句子相似度任务,支持越南语。
🚀 快速开始
量化步骤
可通过以下命令将模型转换为GGUF格式并进行量化:
REL=b3827
wget https://github.com/ggerganov/llama.cpp/releases/download/$REL/llama-$REL-bin-ubuntu-x64.zip --content-disposition --continue &> /dev/null
wget https://github.com/ggerganov/llama.cpp/archive/refs/tags/$REL.zip --content-disposition --continue &> /dev/null
unzip -q llama-$REL-bin-ubuntu-x64.zip
unzip -q llama.cpp-$REL.zip
mv llama.cpp-$REL/* .
rm -r llama.cpp-$REL/ llama-$REL-bin-ubuntu-x64.zip llama.cpp-$REL.zip
pip install -q -r requirements.txt
rm -rf models/tmp/
git clone --depth=1 --single-branch https://huggingface.co/hiieu/halong_embedding models/tmp
huggingface-cli download intfloat/multilingual-e5-base sentencepiece.bpe.model --local-dir models/tmp
python convert_hf_to_gguf.py models/tmp/ --outfile model-f32.gguf --outtype f32
build/bin/llama-quantize model-f32.gguf model-f16.gguf f16 2> /dev/null
build/bin/llama-quantize model-f32.gguf model-bf16.gguf bf16 2> /dev/null
build/bin/llama-quantize model-f32.gguf model-q8_0.gguf q8_0 2> /dev/null
build/bin/llama-quantize model-f32.gguf model-q6_k.gguf q6_k 2> /dev/null
build/bin/llama-quantize model-f32.gguf model-q5_k_m.gguf q5_k_m 2> /dev/null
build/bin/llama-quantize model-f32.gguf model-q5_k_s.gguf q5_k_s 2> /dev/null
build/bin/llama-quantize model-f32.gguf model-q4_k_m.gguf q4_k_m 2> /dev/null
build/bin/llama-quantize model-f32.gguf model-q4_k_s.gguf q4_k_s 2> /dev/null
rm -rf models/yolo/
mkdir -p models/yolo
mv model-*.gguf models/yolo/
touch models/yolo/README.md
huggingface-cli upload halong-embedding-gguf models/yolo .
使用示例
基础用法
可使用以下命令进行嵌入计算:
build/bin/llama-embedding -m model-q5_k_m.gguf -p "Cô ấy cười nói suốt cả ngày" --embd-output-format array 2> /dev/null
高级用法
可启动服务器进行嵌入服务:
build/bin/llama-server --embedding -c 512 -m model-q5_k_m.gguf
📦 安装指南
在执行量化和使用命令前,请确保已经完成以下依赖安装:
pip install -q -r requirements.txt
📄 许可证
本项目采用CC BY 4.0许可证。
📚 详细文档
属性 |
详情 |
模型类型 |
句子相似度 |
训练数据 |
未提及 |
基础模型 |
hiieu/halong_embedding |
库名称 |
sentence-transformers |
许可证 |
CC BY 4.0 |