Emu3 Stage1
Apache-2.0
Emu3は北京智源研究院によって開発されたマルチモーダルモデルで、次のトークンを予測するだけで訓練され、画像、テキスト、動画処理をサポートします。
テキスト生成画像
Transformers

E
BAAI
1,359
26
Emu3 VisionTokenizer
Apache-2.0
Emu3は次トークン予測のみで訓練された新しいマルチモーダルモデルスイートで、生成と知覚タスクの両方で多くの専門モデルを凌駕します
テキスト生成画像
Transformers

E
BAAI
19.82k
58
Oneformer Coco Dinat Large
MIT
統一画像セグメンテーションの単一Transformerアーキテクチャで、意味的セグメンテーション、インスタンスセグメンテーション、パノプティックセグメンテーションの3大タスクをサポート
画像セグメンテーション
Transformers

O
shi-labs
38
7
Oneformer Cityscapes Swin Large
MIT
最初のマルチタスク汎用画像分割フレームワーク。単一モデルでセマンティック/インスタンス/パノラマ分割タスクをサポート
画像セグメンテーション
Transformers

O
shi-labs
1,784
2
Oneformer Ade20k Swin Large
MIT
OneFormerは初のマルチタスク汎用画像分割フレームワークで、単一のモデルでセマンティック分割、インスタンス分割、パノラマ分割のタスクをサポートします。
画像セグメンテーション
Transformers

O
shi-labs
141.57k
24
おすすめAIモデル
Llama 3 Typhoon V1.5x 8b Instruct
タイ語専用に設計された80億パラメータの命令モデルで、GPT-3.5-turboに匹敵する性能を持ち、アプリケーションシナリオ、検索拡張生成、制限付き生成、推論タスクを最適化
大規模言語モデル
Transformers 複数言語対応

L
scb10x
3,269
16
Cadet Tiny
Openrail
Cadet-TinyはSODAデータセットでトレーニングされた超小型対話モデルで、エッジデバイス推論向けに設計されており、体積はCosmo-3Bモデルの約2%です。
対話システム
Transformers 英語

C
ToddGoldfarb
2,691
6
Roberta Base Chinese Extractive Qa
RoBERTaアーキテクチャに基づく中国語抽出型QAモデルで、与えられたテキストから回答を抽出するタスクに適しています。
質問応答システム 中国語
R
uer
2,694
98