4

4M 21 B

EPFL-VILABによって開発
4Mはトークン化とマスキング技術によりマルチモーダル拡張を実現する'任意から任意へ'の基盤モデルトレーニングフレームワーク
ダウンロード数 324
リリース時間 : 6/12/2024

モデル概要

4Mフレームワークでトレーニングされたマルチモーダル基盤モデルは幅広い視覚タスクを実行可能で、未見のタスクやモダリティへの転移が可能、柔軟で制御可能なマルチモーダル生成能力を備えています。

モデル特徴

任意から任意へのマルチモーダル変換
数十のモダリティ間の相互変換と処理をサポート
タスク転移能力
未見のタスクやモダリティへの転移が可能
制御可能な生成
柔軟で制御可能なマルチモーダル生成能力を備える
オープンソースフレームワーク
完全なトレーニングフレームワークと事前学習モデルを提供

モデル能力

マルチモーダルデータ処理
視覚タスク処理
クロスモーダル変換
制御可能なコンテンツ生成

使用事例

コンピュータビジョン
画像理解と生成
様々な視覚理解タスクを処理し関連コンテンツを生成
マルチモーダルアプリケーション
クロスモーダル変換
異なるモダリティデータ間で変換処理を実行
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase