# マルチタスク統合フレームワーク

Q Sit Mini
MIT
Q-SiTは大規模言語モデルを基盤とした画像品質スコアリングと解析システムで、画像品質評価と解析タスクを同時に実行できます。
画像生成テキスト Transformers
Q
zhangzicheng
371
0
Inspiremusic 1.5B
Apache-2.0
InspireMusicは音楽生成、楽曲生成、オーディオ生成に特化した統合フレームワークで、高音質かつ長時間の音楽生成をサポートします。
音声生成 英語
I
FunAudioLLM
31
6
Mask2former Swin Large Mapillary Vistas Semantic
その他
Swinバックボーンネットワークに基づく大規模Mask2Formerモデルで、汎用画像セグメンテーションタスク向けに設計されており、インスタンスセグメンテーション、セマンティックセグメンテーション、パノプティックセグメンテーションを統一的に処理します。
画像セグメンテーション Transformers
M
facebook
5,539
3
Mask2former Swin Small Cityscapes Panoptic
その他
Swinバックボーンネットワークを基にした小型Mask2Formerモデル、Cityscapesデータセットのパノプティックセグメンテーションタスク向けに最適化
画像セグメンテーション Transformers
M
facebook
568
0
Mask2former Swin Small Coco Panoptic
その他
Swinバックボーンネットワークに基づくMask2Formerの小規模バージョンで、COCOデータセットのパノプティックセグメンテーションタスクに最適化されています
画像セグメンテーション Transformers
M
facebook
240
1
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase