# セマンティックエンハンスメント

Languagebind Video Huge V1.5 FT
MIT
LanguageBindは、言語を通じてマルチモーダルの意味的アラインメントを実現する事前学習モデルで、ビデオ、オーディオ、深度、サーモグラフィーなどの様々なモダリティと言語をバインドし、クロスモーダルの理解と検索を可能にします。
マルチモーダルアライメント Transformers
L
LanguageBind
2,711
4
Languagebind Video FT
MIT
LanguageBindは言語を中心としたマルチモーダル事前学習手法で、言語を異なるモダリティ間の絆として、ビデオ、赤外線、深度、音声など様々なモダリティの意味的アライメントを実現します。
マルチモーダルアライメント Transformers
L
LanguageBind
22.97k
4
Languagebind Video Merge
MIT
LanguageBindは、言語ベースのセマンティックアラインメントを通じてビデオ-言語事前学習をNモーダルに拡張するマルチモーダルモデルで、ICLR 2024に採択されました。
マルチモーダルアライメント Transformers
L
LanguageBind
10.96k
4
Languagebind Image
MIT
LanguageBindは言語を中心としたマルチモーダル事前学習手法で、言語を異なるモダリティ間の絆として利用し、セマンティックアラインメントを実現します。
マルチモーダルアライメント Transformers
L
LanguageBind
25.71k
11
Languagebind Depth
MIT
LanguageBindは言語を中心としたマルチモーダル事前学習手法で、言語を異なるモダリティ間の絆として、ビデオ、赤外線、深度、オーディオなど様々なモダリティの意味的アラインメントを実現します。
マルチモーダルアライメント Transformers
L
LanguageBind
898
0
Languagebind Video
MIT
LanguageBindは、言語の意味的アライメントを通じてビデオ-言語事前学習をNモーダルに拡張するマルチモーダル事前学習フレームワークで、ICLR 2024に採録されました。
マルチモーダルアライメント Transformers
L
LanguageBind
166
2
Languagebind Audio
MIT
LanguageBindは言語を中心としたマルチモーダル事前学習手法で、言語意味アラインメントによりビデオ-言語事前学習をNモーダルに拡張し、高性能なマルチモーダル理解とアラインメントを実現しています。
マルチモーダルアライメント Transformers
L
LanguageBind
271
3
Languagebind Thermal
MIT
LanguageBindは言語を紐帯としてマルチモーダルの意味的アラインメントを実現する事前学習フレームワークで、ビデオ、赤外線、深度、音声など様々なモダリティと言語の共同学習をサポートします。
マルチモーダルアライメント Transformers
L
LanguageBind
887
1
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase