高效语言模型

# 高效语言模型

OpenELM是由苹果公司推出的高效语言模型系列，采用分层缩放策略优化参数分配，提供270M至3B不同规模的预训练及指令调优模型。

大型语言模型

RWKV7 Goose World3 1.5B HF

采用闪存线性注意力（flash-linear attention）格式的RWKV-7模型，支持英语文本生成任务。

大型语言模型

Safetensors 英语

Bitnet B1 58 Xl Q8 0 Gguf

BitNet b1.58 是一种1.58位量化的大型语言模型，通过降低权重精度来减少计算资源需求，同时保持接近全精度模型的性能。

大型语言模型

Openelm 3B Instruct

OpenELM是一组开源高效语言模型，采用分层参数分配策略提升模型精度，包含2.7亿至30亿参数的预训练及指令调优版本。

大型语言模型

Openelm 1 1B Instruct

OpenELM是一组开源高效语言模型，采用分层缩放策略在Transformer模型的每一层中高效分配参数，从而提升模型精度。

大型语言模型

Openelm 450M Instruct

OpenELM是一组开源高效语言模型，采用分层缩放策略优化参数分配，包含2.7亿至30亿参数的预训练及指令调优版本。

大型语言模型

OpenELM是一组开源高效语言模型，采用分层缩放策略优化参数分配，提升模型准确率。包含270M、450M、1.1B和3B四种参数规模，提供预训练和指令调优版本。

大型语言模型

OpenELM是一组开放的高效语言模型，采用分层缩放策略优化参数分配，提升模型精度。提供2.7亿至30亿参数的预训练及指令调优版本。

大型语言模型

OpenELM是一组开源高效语言模型，采用分层缩放策略在Transformer模型的每一层中高效分配参数，提升准确性。

大型语言模型

Retnet 410m XATL

基于RetNet架构与Transformer混合的线性计算成本推理模型，通过跨架构迁移学习实现

大型语言模型

Transformers 英语

Tinybert L 4 H 312 V2 Finetuned Wikitext103

该模型是在wikitext数据集上对TinyBERT_L-4_H-312_v2进行微调的版本，主要用于文本相关任务。

大型语言模型

精选推荐AI模型

Llama 3 Typhoon V1.5x 8b Instruct

专为泰语设计的80亿参数指令模型，性能媲美GPT-3.5-turbo，优化了应用场景、检索增强生成、受限生成和推理任务

大型语言模型

Transformers 支持多种语言

Cadet-Tiny是一个基于SODA数据集训练的超小型对话模型，专为边缘设备推理设计，体积仅为Cosmo-3B模型的2%左右。

Transformers 英语

Roberta Base Chinese Extractive Qa

基于RoBERTa架构的中文抽取式问答模型，适用于从给定文本中提取答案的任务。

问答系统中文

AIbase

智启未来，您的人工智能解决方案智库

English 简体中文繁體中文にほんご

© 2025AIbase