# ビデオ-言語事前学習

Languagebind Video V1.5 FT
MIT
LanguageBindは言語を中心としたマルチモーダル事前学習手法で、言語を異なるモダリティ間の絆として利用し、マルチモーダル意味アラインメントを実現します。
マルチモーダルアライメント Transformers
L
LanguageBind
853
5
Languagebind Video FT
MIT
LanguageBindは言語を中心としたマルチモーダル事前学習手法で、言語を異なるモダリティ間の絆として、ビデオ、赤外線、深度、音声など様々なモダリティの意味的アライメントを実現します。
マルチモーダルアライメント Transformers
L
LanguageBind
22.97k
4
Languagebind Depth
MIT
LanguageBindは言語を中心としたマルチモーダル事前学習手法で、言語を異なるモダリティ間の絆として、ビデオ、赤外線、深度、オーディオなど様々なモダリティの意味的アラインメントを実現します。
マルチモーダルアライメント Transformers
L
LanguageBind
898
0
Languagebind Audio
MIT
LanguageBindは言語を中心としたマルチモーダル事前学習手法で、言語意味アラインメントによりビデオ-言語事前学習をNモーダルに拡張し、高性能なマルチモーダル理解とアラインメントを実現しています。
マルチモーダルアライメント Transformers
L
LanguageBind
271
3
Languagebind Thermal
MIT
LanguageBindは言語を紐帯としてマルチモーダルの意味的アラインメントを実現する事前学習フレームワークで、ビデオ、赤外線、深度、音声など様々なモダリティと言語の共同学習をサポートします。
マルチモーダルアライメント Transformers
L
LanguageBind
887
1
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase