4

4M 7 B CC12M

EPFL-VILABによって開発
4Mは'任意から任意'のマルチモーダル基盤モデルを訓練するフレームワークで、トークン化とマスキング技術により複数の異なるモーダルに拡張可能です。
ダウンロード数 209
リリース時間 : 3/25/2024

モデル概要

4Mフレームワークで訓練されたモデルは、幅広い視覚タスクを実行でき、未見のタスクやモーダルにも良好に転移し、柔軟で制御可能なマルチモーダル生成モデルです。

モデル特徴

任意から任意モーダル変換
複数の異なるモーダル間の相互変換をサポート
大規模マルチモーダルサポート
数十種類の異なるモーダルやタスクに拡張可能
優れた転移能力
未見のタスクやモーダルにも良好に転移可能
柔軟で制御可能な生成
マルチモーダル生成モデルとして高い柔軟性と制御性を有する

モデル能力

マルチモーダルデータ変換
視覚タスク処理
マルチモーダル生成
クロスモーダル転移学習

使用事例

コンピュータビジョン
画像生成
他のモーダルデータから画像を生成
視覚的質問応答
視覚と言語モーダルを組み合わせて質問に回答
マルチモーダルアプリケーション
クロスモーダル検索
異なるモーダルデータ間で検索を実行
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase