G

Gemma 3n E4B It 4bit MLX

由NexaAI開發
Gemma 3n 是基於 Google Gemma 模型的多模態輕量級開源模型,支持文本、圖像、視頻和音頻輸入,專為低資源設備優化。
下載量 122
發布時間 : 7/13/2025

模型概述

Gemma 3n 是 Google 推出的輕量級開源模型,採用與 Gemini 相同的技術,支持多模態輸入和文本輸出,適用於低資源設備。

模型特點

多模態支持
能夠處理文本、圖像、音頻和視頻輸入,並生成文本輸出。
低資源優化
採用選擇性參數激活技術,降低資源需求,適合在低資源設備上運行。
高效參數管理
以 20 億和 40 億參數的有效規模運行,低於總參數數量。
多語言支持
使用超過 140 種口語語言的數據進行訓練,具備強大的多語言處理能力。

模型能力

文本生成
圖像內容分析
音頻數據處理
視頻內容理解
多語言文本處理

使用案例

內容生成
文檔摘要
輸入長文檔,生成簡潔的摘要。
高效生成準確且連貫的摘要。
問題回答
輸入問題,生成詳細的答案。
在多個基準測試中表現優異。
多模態分析
圖像描述生成
輸入圖像,生成詳細的文字描述。
支持多種分辨率,生成高質量描述。
音頻轉錄
輸入音頻數據,生成文字轉錄。
每秒編碼為 6.25 個標記,單聲道支持。
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase