4M 7 B CC12M
4Mは'任意から任意'のマルチモーダル基盤モデルを訓練するフレームワークで、トークン化とマスキング技術により複数の異なるモーダルに拡張可能です。
Downloads 209
Release Time : 3/25/2024
Model Overview
4Mフレームワークで訓練されたモデルは、幅広い視覚タスクを実行でき、未見のタスクやモーダルにも良好に転移し、柔軟で制御可能なマルチモーダル生成モデルです。
Model Features
任意から任意モーダル変換
複数の異なるモーダル間の相互変換をサポート
大規模マルチモーダルサポート
数十種類の異なるモーダルやタスクに拡張可能
優れた転移能力
未見のタスクやモーダルにも良好に転移可能
柔軟で制御可能な生成
マルチモーダル生成モデルとして高い柔軟性と制御性を有する
Model Capabilities
マルチモーダルデータ変換
視覚タスク処理
マルチモーダル生成
クロスモーダル転移学習
Use Cases
コンピュータビジョン
画像生成
他のモーダルデータから画像を生成
視覚的質問応答
視覚と言語モーダルを組み合わせて質問に回答
マルチモーダルアプリケーション
クロスモーダル検索
異なるモーダルデータ間で検索を実行
Featured Recommended AI Models
Llama 3 Typhoon V1.5x 8b Instruct
タイ語専用に設計された80億パラメータの命令モデルで、GPT-3.5-turboに匹敵する性能を持ち、アプリケーションシナリオ、検索拡張生成、制限付き生成、推論タスクを最適化
大規模言語モデル
Transformers Supports Multiple Languages

L
scb10x
3,269
16
Cadet Tiny
Openrail
Cadet-TinyはSODAデータセットでトレーニングされた超小型対話モデルで、エッジデバイス推論向けに設計されており、体積はCosmo-3Bモデルの約2%です。
対話システム
Transformers English

C
ToddGoldfarb
2,691
6
Roberta Base Chinese Extractive Qa
RoBERTaアーキテクチャに基づく中国語抽出型QAモデルで、与えられたテキストから回答を抽出するタスクに適しています。
質問応答システム Chinese
R
uer
2,694
98