多尺寸可选

# 多尺寸可选

React Native Executorch Qwen 3

Qwen 3 是一个基于 ExecuTorch 运行时的语言模型，提供不同规模的量化与未量化版本。

大型语言模型

software-mansion

Openelm 450M Instruct

OpenELM是一组开源高效语言模型，采用分层缩放策略优化参数分配，包含2.7亿至30亿参数的预训练及指令调优版本。

大型语言模型

Chinese Roberta L 2 H 512

基于CLUECorpusSmall预训练的中文RoBERTa模型，包含8层网络和512维隐藏层，适用于多种中文NLP任务。

大型语言模型中文

Roberta Base Word Chinese Cluecorpussmall

基于CLUECorpusSmall语料预训练的中文分词版RoBERTa中型模型，采用分词处理提升序列处理效率

大型语言模型中文

AraGPT2是基于GPT2架构预训练的阿拉伯语生成模型，由AUB MIND实验室开发，支持多种规模的模型变体。

大型语言模型阿拉伯语

Chinese Roberta L 12 H 768

基于RoBERTa架构的中文预训练语言模型，隐藏层维度512，包含8层Transformer结构

大型语言模型中文

Chinese Roberta L 4 H 512

这是一个基于RoBERTa架构的中文预训练语言模型，参数规模为8层512隐藏单元，适用于多种中文自然语言处理任务。

大型语言模型中文

Roberta Small Word Chinese Cluecorpussmall

基于CLUECorpusSmall预训练的中文词级别RoBERTa中型模型，相比字符级模型在多项任务中表现更优

大型语言模型中文

Chinese Roberta L 6 H 256

基于CLUECorpusSmall预训练的中文RoBERTa模型，参数规模为8层512隐藏单元

大型语言模型中文

Ptt5 Large T5 Vocab

PTT5是基于BrWac语料库预训练的T5模型，专门针对葡萄牙语优化，提供多种尺寸和词汇表选择。

大型语言模型

Transformers 其他

AraGPT2是一个针对阿拉伯语生成任务预训练的大型语言模型系列，包含基础版、中型、大型和巨型四种规模。

大型语言模型

Transformers 阿拉伯语

精选推荐AI模型

Llama 3 Typhoon V1.5x 8b Instruct

专为泰语设计的80亿参数指令模型，性能媲美GPT-3.5-turbo，优化了应用场景、检索增强生成、受限生成和推理任务

大型语言模型

Transformers 支持多种语言

Cadet-Tiny是一个基于SODA数据集训练的超小型对话模型，专为边缘设备推理设计，体积仅为Cosmo-3B模型的2%左右。

Transformers 英语

Roberta Base Chinese Extractive Qa

基于RoBERTa架构的中文抽取式问答模型，适用于从给定文本中提取答案的任务。

问答系统中文

AIbase

智启未来，您的人工智能解决方案智库

English 简体中文繁體中文にほんご

© 2025AIbase