邊緣計算優化

# 邊緣計算優化

Devstral Small 2505 GGUF

Devstral-Small-2505的量化版本，提供多種精度選擇以適應不同硬件需求

大型語言模型支持多種語言

Japanese Reranker Tiny V2

這是一個非常小巧且快速的日語重排序模型，適用於提升RAG系統的精度，在CPU或邊緣設備上也能高效運行。

文本嵌入日語

GLM Z1 9B 0414 GGUF

GLM-Z1-9B-0414 是一個支持中英雙語的文本生成模型，採用 GGUF 格式，適用於多種量化級別，從 BF16 到超低位量化（1-2 比特）。

大型語言模型支持多種語言

Granite 3.3 8b Instruct GGUF

採用IQ-DynamicGate技術的超低位量化(1-2比特)語言模型，適用於內存受限環境

大型語言模型

Falcon E 3B Instruct

Falcon-E-3B-Instruct 是一個基於1.58比特架構的高效語言模型，專為邊緣設備優化，具有出色的推理能力和低內存佔用。

大型語言模型

Falcon E 1B Instruct

Falcon-E-1B-Instruct 是一個基於1.58比特架構的高效語言模型，專為邊緣設備優化，具有低內存佔用和高性能的特點。

大型語言模型

Falcon E 1B Base

Falcon-E-1B-Base 是由 TII 開發的一個高效 1.58 位語言模型，採用純 Transformer 架構，專為邊緣設備優化設計。

大型語言模型

Meta Llama 3 8B Instruct GGUF

基於Llama-3-8B-Instruct的IQ-DynamicGate超低位量化(1-2比特)模型，採用精度自適應量化技術，在保持極致內存效率的同時提升推理精度。

大型語言模型英語

Glm Edge V 5b Gguf

Glm-Edge-V-5B-GGUF是一個支持中英文的多語言圖文生成文本模型，基於GLM架構開發。

大型語言模型支持多種語言

FLUX.1 Canny Dev GGUF

FLUX.1-Canny-dev 是一個基於文本生成圖像的模型，專注於圖像生成任務。

文本生成圖像英語

GLM-Edge-V-2B是一個基於Pytorch框架的圖像文本到文本模型，支持中文處理。

圖像生成文本

基於TinyLlama-1.1B-Chat-v1.0的混合模型，提供輕量級LLM解決方案

大型語言模型

MIT Ast Finetuned Speech Commands V2 Ov

這是一個基於MIT/ast-finetuned-speech-commands-v2轉換的OpenVINO優化版本，用於加速語音指令識別任務的推理運算。

Transformers 英語

精選推薦AI模型

Llama 3 Typhoon V1.5x 8b Instruct

專為泰語設計的80億參數指令模型，性能媲美GPT-3.5-turbo，優化了應用場景、檢索增強生成、受限生成和推理任務

大型語言模型

Transformers 支持多種語言

Cadet-Tiny是一個基於SODA數據集訓練的超小型對話模型，專為邊緣設備推理設計，體積僅為Cosmo-3B模型的2%左右。

Transformers 英語

Roberta Base Chinese Extractive Qa

基於RoBERTa架構的中文抽取式問答模型，適用於從給定文本中提取答案的任務。

問答系統中文

AIbase

智啟未來，您的人工智能解決方案智庫

English 简体中文繁體中文にほんご

© 2025AIbase