MT-gemma-3-12B開源語言模型 - 合併兩模型，提供強大語言處理能力

首頁

MT Gemma 3 12B

由zelk12開發

本項目使用mergekit和DARE TIES方法合併了soob3123/amoral-gemma3-12B-v2和IlyaGusev/saiga_gemma3_12b兩個模型，旨在提供更強大的語言處理能力。

大型語言模型

Transformers

#多模型融合 #道德中立增強 #俄語優化

下載量 1,348

發布時間 : 5/2/2025

模型概述

通過合併多個預訓練語言模型的優勢，解決單一模型在某些場景下性能不足的問題，提供更全面的語言處理能力。

模型特點

模型合併技術

採用DARE TIES先進合併方法，結合多個模型的優勢

高性能處理

基於12B參數的Gemma3架構，提供強大的語言處理能力

多模型優勢整合

整合了amoral-gemma3和saiga_gemma3兩個模型的特性

模型能力

文本生成

語言理解

多模態處理

使用案例

自然語言處理

多語言文本生成

生成高質量的多語言文本內容

複雜語言理解

處理和理解複雜的語言結構和含義

多模態應用

圖像到文本轉換

將圖像內容轉換為描述性文本

屬性	詳情
基礎模型	IlyaGusev/saiga_gemma3_12b、soob3123/amoral-gemma3-12B-v2
庫名稱	transformers
標籤	mergekit、merge
許可證	gemma
任務類型	圖像文本到文本

精選推薦AI模型

Llama 3 Typhoon V1.5x 8b Instruct

專為泰語設計的80億參數指令模型，性能媲美GPT-3.5-turbo，優化了應用場景、檢索增強生成、受限生成和推理任務

Cadet-Tiny是一個基於SODA數據集訓練的超小型對話模型，專為邊緣設備推理設計，體積僅為Cosmo-3B模型的2%左右。

Roberta Base Chinese Extractive Qa

基於RoBERTa架構的中文抽取式問答模型，適用於從給定文本中提取答案的任務。

智啟未來，您的人工智能解決方案智庫

MT Gemma 3 12B

模型概述

模型特點

模型能力

使用案例

🚀 模型合併項目

🚀 快速開始

📚 詳細文檔

合併詳情

合併方法

參與合併的模型

配置信息

📄 許可證

📦 模型信息