边缘设备推理

# 边缘设备推理

Voice Based Stress Recognition

轻量级语音压力识别模型，通过知识蒸馏技术训练，适用于边缘设备实时压力检测

Dans PersonalityEngine V1.3.0 24b GGUF

Dans-PersonalityEngine-V1.3.0-24b是一个多功能模型系列，在50多个专业数据集上进行了微调，支持多语言和专业领域任务。

大型语言模型

Josiefied Qwen3 8B Abliterated V1 GGUF

基于Qwen3-8B的量化版本，采用IQ-DynamicGate超低位量化技术，优化内存效率和推理速度

大型语言模型

Llama Xlam 2 8b Fc R GGUF

Salesforce开发的8B参数大型动作模型(LAM)，专注于将用户意图转化为可执行动作，在多轮对话和工具使用方面表现优异。

大型语言模型英语

Qwen2.5 7B Instruct GGUF

Qwen2.5-7B-Instruct是基于Qwen2.5-7B的指令微调模型，支持文本生成任务，特别优化了聊天场景下的表现。

大型语言模型英语

Qwen2.5 3B Instruct GGUF

采用IQ-DynamicGate技术的超低位量化（1-2位）模型，适用于内存受限设备和高效推理场景

大型语言模型英语

GLM Z1 32B 0414 GGUF

GLM-Z1-32B-0414是一个32B参数规模的多语言文本生成模型，支持中文和英文，采用MIT许可证发布。

大型语言模型支持多种语言

Deepcoder 14B Preview GGUF

采用IQ-DynamicGate技术的超低位量化(1-2比特)模型，适用于内存受限设备和边缘计算场景

大型语言模型英语

Olmo 2 0325 32B Instruct GGUF

基于OLMo-2-0325-32B-DPO的指令微调模型，采用IQ-DynamicGate超低比特量化技术，专为内存受限环境优化。

大型语言模型英语

Granite 3.2 8b Instruct GGUF

IBM Granite系列8B参数指令微调语言模型，采用IQ-DynamicGate超低比特量化技术，适用于高效推理场景

大型语言模型

Mistral 7B Instruct V0.1 GGUF

Mistral-7B-Instruct-v0.1是一个基于Mistral-7B-v0.1的微调模型，支持文本生成任务，采用IQ-DynamicGate超低比特量化技术，适用于内存受限的部署环境。

大型语言模型

Llama 3.2 3B Instruct Frog

专为越南语优化的RAG版LLaMA3.2模型，基于Meta的轻量级LLM开发，适合本地和边缘设备部署。

大型语言模型

Safetensors 支持多种语言

精选推荐AI模型

Llama 3 Typhoon V1.5x 8b Instruct

专为泰语设计的80亿参数指令模型，性能媲美GPT-3.5-turbo，优化了应用场景、检索增强生成、受限生成和推理任务

大型语言模型

Transformers 支持多种语言

Cadet-Tiny是一个基于SODA数据集训练的超小型对话模型，专为边缘设备推理设计，体积仅为Cosmo-3B模型的2%左右。

Transformers 英语

Roberta Base Chinese Extractive Qa

基于RoBERTa架构的中文抽取式问答模型，适用于从给定文本中提取答案的任务。

问答系统中文

AIbase

智启未来，您的人工智能解决方案智库

English 简体中文繁體中文にほんご

© 2025AIbase