自注意力优化

# 自注意力优化

Cursa O1 7b V1.1

这是一个通过SLERP方法融合的预训练语言模型，结合了pre-cursa-o1-v1.2和post-cursa-o1两个模型的优势。

大型语言模型

marcuscedricridia

基于扩散模型的零样本视频编辑方案，通过合并视频帧间的自注意力令牌提升时间连贯性并降低内存消耗。

文本生成视频

Koala Lightning 1b

KOALA-Lightning-1B是基于SDXL-Lightning的知识蒸馏模型，通过压缩U-Net结构实现高效文本生成图像，参数规模1.16B

文本生成图像

MISTRALNEURAL 7B Slerp

MISTRALNEURAL-7B-slerp是通过mergekit工具融合Mistral-7B和Neural-Chat-7B两个模型而成的7B参数大语言模型

大型语言模型

Eris LelantaclesV2 7b

该模型是通过SLERP方法合并Eros-7b-test和Eris-Lelanacles-7b两个7B参数模型得到的混合模型

大型语言模型

ChaoticNeutrals

M7-7b 是一个通过 mergekit 工具融合多个 7B 参数规模模型的实验性项目，旨在整合不同模型的优势以提升性能。

大型语言模型

Blockchainlabs 7B Merged Test2 4

blockchainlabs_7B_merged_test2_4 是通过 mergekit 工具融合 mlabonne/NeuralBeagle14-7B 和 udkai/Turdus 两个模型而成的7B参数规模的大语言模型。

大型语言模型

PaViT是基于Pathway Vision Transformer的图像识别模型，灵感来源于谷歌的PaLM，专注于小样本学习技术在图像识别任务中的应用。

图像分类支持多种语言

精选推荐AI模型

Llama 3 Typhoon V1.5x 8b Instruct

专为泰语设计的80亿参数指令模型，性能媲美GPT-3.5-turbo，优化了应用场景、检索增强生成、受限生成和推理任务

大型语言模型

Transformers 支持多种语言

Cadet-Tiny是一个基于SODA数据集训练的超小型对话模型，专为边缘设备推理设计，体积仅为Cosmo-3B模型的2%左右。

Transformers 英语

Roberta Base Chinese Extractive Qa

基于RoBERTa架构的中文抽取式问答模型，适用于从给定文本中提取答案的任务。

问答系统中文

AIbase

智启未来，您的人工智能解决方案智库

English 简体中文繁體中文にほんご

© 2025AIbase