自注意力優化

# 自注意力優化

Cursa O1 7b V1.1

這是一個通過SLERP方法融合的預訓練語言模型，結合了pre-cursa-o1-v1.2和post-cursa-o1兩個模型的優勢。

大型語言模型

marcuscedricridia

基於擴散模型的零樣本視頻編輯方案，通過合併視頻幀間的自注意力令牌提升時間連貫性並降低內存消耗。

文本生成視頻

Koala Lightning 1b

KOALA-Lightning-1B是基於SDXL-Lightning的知識蒸餾模型，通過壓縮U-Net結構實現高效文本生成圖像，參數規模1.16B

文本生成圖像

MISTRALNEURAL 7B Slerp

MISTRALNEURAL-7B-slerp是通過mergekit工具融合Mistral-7B和Neural-Chat-7B兩個模型而成的7B參數大語言模型

大型語言模型

Eris LelantaclesV2 7b

該模型是通過SLERP方法合併Eros-7b-test和Eris-Lelanacles-7b兩個7B參數模型得到的混合模型

大型語言模型

ChaoticNeutrals

M7-7b 是一個通過 mergekit 工具融合多個 7B 參數規模模型的實驗性項目，旨在整合不同模型的優勢以提升性能。

大型語言模型

Blockchainlabs 7B Merged Test2 4

blockchainlabs_7B_merged_test2_4 是通過 mergekit 工具融合 mlabonne/NeuralBeagle14-7B 和 udkai/Turdus 兩個模型而成的7B參數規模的大語言模型。

大型語言模型

PaViT是基於Pathway Vision Transformer的圖像識別模型，靈感來源於谷歌的PaLM，專注於小樣本學習技術在圖像識別任務中的應用。

圖像分類支持多種語言

精選推薦AI模型

Llama 3 Typhoon V1.5x 8b Instruct

專為泰語設計的80億參數指令模型，性能媲美GPT-3.5-turbo，優化了應用場景、檢索增強生成、受限生成和推理任務

大型語言模型

Transformers 支持多種語言

Cadet-Tiny是一個基於SODA數據集訓練的超小型對話模型，專為邊緣設備推理設計，體積僅為Cosmo-3B模型的2%左右。

Transformers 英語

Roberta Base Chinese Extractive Qa

基於RoBERTa架構的中文抽取式問答模型，適用於從給定文本中提取答案的任務。

問答系統中文

AIbase

智啟未來，您的人工智能解決方案智庫

English 简体中文繁體中文にほんご

© 2025AIbase