モデル選定

マルチタスク統合フレームワーク

# マルチタスク統合フレームワーク

Q-SiTは大規模言語モデルを基盤とした画像品質スコアリングと解析システムで、画像品質評価と解析タスクを同時に実行できます。

画像生成テキスト

Inspiremusic 1.5B

InspireMusicは音楽生成、楽曲生成、オーディオ生成に特化した統合フレームワークで、高音質かつ長時間の音楽生成をサポートします。

音声生成英語

Mask2former Swin Large Mapillary Vistas Semantic

Swinバックボーンネットワークに基づく大規模Mask2Formerモデルで、汎用画像セグメンテーションタスク向けに設計されており、インスタンスセグメンテーション、セマンティックセグメンテーション、パノプティックセグメンテーションを統一的に処理します。

画像セグメンテーション

Mask2former Swin Small Cityscapes Panoptic

Swinバックボーンネットワークを基にした小型Mask2Formerモデル、Cityscapesデータセットのパノプティックセグメンテーションタスク向けに最適化

画像セグメンテーション

Mask2former Swin Small Coco Panoptic

Swinバックボーンネットワークに基づくMask2Formerの小規模バージョンで、COCOデータセットのパノプティックセグメンテーションタスクに最適化されています

画像セグメンテーション

おすすめAIモデル

Llama 3 Typhoon V1.5x 8b Instruct

タイ語専用に設計された80億パラメータの命令モデルで、GPT-3.5-turboに匹敵する性能を持ち、アプリケーションシナリオ、検索拡張生成、制限付き生成、推論タスクを最適化

大規模言語モデル

Transformers 複数言語対応

Cadet-TinyはSODAデータセットでトレーニングされた超小型対話モデルで、エッジデバイス推論向けに設計されており、体積はCosmo-3Bモデルの約2％です。

対話システム

Transformers 英語

Roberta Base Chinese Extractive Qa

RoBERTaアーキテクチャに基づく中国語抽出型QAモデルで、与えられたテキストから回答を抽出するタスクに適しています。

質問応答システム中国語

AIbase

未来を切り開く、あなたのAIソリューション知識ベース

English 简体中文繁體中文にほんご

© 2025AIbase