Ichigo-llama3.1-s-instruct-v0.4-GGUF開源模型 - 多量化版本適配不同硬件需求

Ichigo Llama3.1 S Instruct V0.4 GGUF

由mradermacher開發

基於Menlo/Ichigo-llama3.1-s-instruct-v0.4的靜態量化模型，提供多種量化版本，適用於不同硬件需求。

下載量 369

發布時間 : 11/8/2024

模型概述

這是一個基於Llama架構的量化語言模型，主要用於指令跟隨和文本生成任務。模型經過靜態量化處理，提供多種精度版本以適應不同計算環境。

多種量化版本

提供從Q2_K到f16共13種不同量化版本，適應不同硬件性能和精度需求

高效推理

量化版本顯著減小模型大小並提高推理速度，適合資源受限環境

跨平臺兼容

GGUF格式支持多種平臺和設備，包括ARM架構

文本生成

指令跟隨

英語語言處理

自然語言處理

對話系統

構建英語對話機器人

文本生成

生成連貫的英語文本

本項目提供了 Ichigo-llama3.1-s-instruct-v0.4 模型的靜態量化版本，適用於聲音語言處理任務，如音頻文本轉換等。

如果你不確定如何使用 GGUF 文件，請參考 TheBloke 的 README 獲取更多詳細信息，包括如何拼接多部分文件。

屬性	詳情
基礎模型	Menlo/Ichigo-llama3.1-s-instruct-v0.4
數據集	homebrewltd/instruction-speech-whispervq-v2
語言	英語
庫名稱	transformers
量化者	mradermacher
標籤	聲音語言模型、音頻文本轉換、torchtune
許可證	apache-2.0

（按大小排序，不一定代表質量。IQ 量化通常優於類似大小的非 IQ 量化）

鏈接	類型	大小/GB	說明
GGUF	Q2_K	3.3
GGUF	Q3_K_S	3.8
GGUF	Q3_K_M	4.1	質量較低
GGUF	Q3_K_L	4.4
GGUF	IQ4_XS	4.6
GGUF	Q4_0_4_4	4.8	在 ARM 上速度快，質量低
GGUF	Q4_K_S	4.8	速度快，推薦使用
GGUF	Q4_K_M	5.0	速度快，推薦使用
GGUF	Q5_K_S	5.7
GGUF	Q5_K_M	5.8
GGUF	Q6_K	6.7	質量非常好
GGUF	Q8_0	8.6	速度快，質量最佳
GGUF	f16	16.2	16 位每權重，有些過度