4

4M 21 L

EPFL-VILABによって開発
4Mはトークン化とマスキング技術を複数のモダリティに拡張した'任意から任意'の基盤モデルトレーニングフレームワークです
ダウンロード数 49
リリース時間 : 6/12/2024

モデル概要

4Mでトレーニングされたモデルは幅広い視覚タスクを実行でき、未見のタスクやモダリティに転移可能で、柔軟で制御可能なマルチモーダル生成能力を備えています

モデル特徴

任意から任意のマルチモーダル処理
数十のモダリティとタスクに対応する柔軟な処理能力
拡張性
新しいモダリティやタスクへの拡張をサポートするフレームワーク設計
転移学習能力
未見のタスクやモダリティに転移可能
制御可能なマルチモーダル生成
柔軟で制御可能なマルチモーダル生成能力

モデル能力

マルチモーダルマスキングモデリング
視覚タスク処理
クロスモーダル転移学習
制御可能なコンテンツ生成

使用事例

コンピュータビジョン
マルチモーダル視覚理解
複数の視覚モダリティデータを処理・理解する
生成AI
制御可能なコンテンツ生成
入力条件に基づいてマルチモーダルコンテンツを生成する
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase