# Transformerアーキテクチャ

Sundial Base 128m
Apache-2.0
日時計は一連の生成的時系列基礎モデルであり、確定的予測と確率予測に対してゼロショット推論が可能です。
気候モデル Safetensors
S
thuml
214
5
Ast Finetuned Audioset 10 10 0.4593 ONNX
これはAST(Audio Spectrogram Transformer)モデルのONNXバージョンで、音声分類タスク用に設計され、AudioSetデータセットで微調整されています。
音声分類 Transformers
A
onnx-community
684
1
Wav2vec2 Base Librispeech Demo Colab
Apache-2.0
このモデルはfacebook/wav2vec2-baseをLibriSpeechデータセットでファインチューニングした音声認識モデルで、評価セットで0.3174の単語誤り率を達成しました。
音声認識 Transformers
W
vishwasgautam
14
0
Falcon E 3B Instruct
その他
Falcon-E-3B-Instructは1.58ビットアーキテクチャに基づく高効率な言語モデルで、エッジデバイス向けに最適化されており、優れた推論能力と低メモリ消費を特徴とします。
大規模言語モデル Transformers
F
tiiuae
225
22
Videomae Base Finetuned Ucf101 Subset
VideoMAEベースモデルをUCF101サブセットでファインチューニングしたビデオ分類モデル
動画処理 Transformers
V
cccchristopher
30
0
X2I
Apache-2.0
X2Iはマルチモーダル拡散Transformerモデルで、テキスト、画像、動画、音声、音声など複数の入力モダリティを画像出力に変換できます。
テキスト生成画像 その他
X
OPPOer
435
7
Latex Finetuned
Transformerベースの光学文字認識モデルで、手書き数式画像と構造化数学構文の処理に最適化されています。
文字認識 Transformers
L
tjoab
109
1
Unixcoder Code Vulnerability Detector
MicrosoftのUniXcoderを微調整したC/C++コードバグ検出モデルで、正解率68.34%、F1スコア62.14%
テキスト分類 Transformers 英語
U
mahdin70
416
1
Digitaledutransformers
Gpl-3.0
Transformerアーキテクチャに基づく表形式分類モデルで、金融分野のデータ分析に使用
テキスト分類 Transformers
D
SnowFlash383935
149
1
Dna2vec
MIT
Transformerアーキテクチャに基づくDNA配列埋め込みモデル、配列アラインメントとゲノミクス応用をサポート
分子モデル Transformers
D
roychowdhuryresearch
557
1
Finedefics
Finedeficsはオープンソースのマルチモーダル大規模言語モデル(MLLM)で、オブジェクトの情報的属性記述を組み込むことで、細粒度視覚認識(FGVR)能力を強化しています。
画像生成テキスト
F
StevenHH2000
82
6
Terjman Large V2.0
テルジャマン大型-v2.0はTransformerアーキテクチャに基づく英語-モロッコ方言翻訳モデルで、性能が大幅に向上し、商用モデルと同等のパフォーマンスを発揮します。
機械翻訳 Transformers 複数言語対応
T
BounharAbdelaziz
20
1
Bidi Eng Pol
Transformerアーキテクチャに基づく双方向機械翻訳モデルで、スラブ語族言語間の相互翻訳をサポート
機械翻訳 Transformers 複数言語対応
B
allegro
185
1
Vit Large Patch14 Dinov2.lvd142m
Apache-2.0
視覚Transformer(ViT)ベースの画像特徴モデルで、自己教師ありDINOv2手法を用いてLVD-142Mデータセットで事前学習済み。
画像分類 Transformers
V
pcuenq
18
0
Vit Liveness Detection V1.0
Apache-2.0
このモデルはTransformerライブラリに基づく顔生体検知モデルで、評価セットで優れた性能を発揮しました。
人の顔に関係がある Transformers
V
nguyenkhoa
176
1
Tabpfn Mix 1.0 Regressor
Apache-2.0
TabPFNMixは純粋な合成データセットで事前学習された表データ基礎モデルで、エンコーダ-デコーダTransformer構造を採用し、表データ回帰タスクに適しています。
材料科学 Safetensors
T
autogluon
3,474
13
Tabpfn Mix 1.0 Classifier
Apache-2.0
表データに基づく基礎モデルで、事前学習データはランダム分類器の混合から生成された合成データセットに由来します
分子モデル
T
autogluon
19.77k
13
Rtdetr V2 R101vd
Apache-2.0
RT-DETRv2はTransformerアーキテクチャに基づくリアルタイム物体検出モデルで、改良されたベースラインモデルと無料テクニックパックにより性能を向上させています。
物体検出 Transformers
R
apolloparty
25
0
Pixart Sigma Nitro
Apache-2.0
AMD Nitro Diffusionは、AMD Instinct™ GPU向けに主流の拡散モデルから蒸留された効率的なテキスト生成画像モデルのシリーズです。PixArt-Sigma Nitroは、Transformerベースの高解像度単段推論モデルです。
画像生成
P
amd
21
2
Trocr Base Handwritten Ru
TrOCRモデルはTransformerベースの光学文字認識モデルで、特にロシア語手書きテキスト向けにファインチューニングされています。
画像生成テキスト Transformers その他
T
kazars24
1,843
9
Materials.selfies Ted
Apache-2.0
Transformerアーキテクチャに基づくエンコーダ-デコーダモデルで、SELFIESを用いた分子特性評価のために設計
分子モデル Transformers
M
ibm-research
3,343
7
Speecht5 Fine Tune En
MIT
マイクロソフトのSpeechT5モデルをファインチューニングした英語音声合成(TTS)モデルで、技術分野のテキスト音声生成に特化
音声合成 Transformers 英語
S
Solo448
16
0
MOMENT 1 Base
MIT
MOMENTは汎用的な時系列分析基盤モデルのシリーズで、予測、分類、異常検知など多様な時系列分析タスクをサポートし、すぐに使用可能かつ微調整可能な特性を備えています。
材料科学 Transformers
M
AutonLab
4,975
3
Pgtformer Base
PGTFormerはPyTorchベースの画像間変換モデルで、PytorchModelHubMixinを通じてHugging Face Hubに統合されています。
画像生成
P
kepeng
151
4
Speecht5 Finetuned Emirhan Tr
MIT
Microsoft SpeechT5をファインチューニングしたトルコ語テキスト音声変換モデルで、高品質なトルコ語音声を生成できます。
音声合成 TensorBoard その他
S
emirhanbilgic
22
1
Swahili English Translation
MIT
スワヒリ語と英語の双方向翻訳のために開発されたTransformerモデルで、21万の言語ペアで微調整されています
機械翻訳 Transformers
S
Bildad
98
2
Timesformer Base Finetuned K400
TimeSformerはTransformerベースのビデオ理解モデルで、Kinetics-400データセット向けに特別にファインチューニングされています。
動画処理 Transformers
T
onnx-community
17
0
Segformer B2 Human
その他
SegFormerアーキテクチャに基づくファッション画像セグメンテーションモデルで、人物の衣服やアクセサリーの精密なセグメンテーションに特化
画像セグメンテーション Transformers
S
sayeed99
46
1
Trocr Math Handwritten
TrOCRはTransformerベースのOCRモデルで、手書き数学式の認識に特化しています
画像生成テキスト Transformers
T
fhswf
290
6
Birna Bert
BERTアーキテクチャに基づくTransformerエンコーダモデルで、RNAシーケンス埋め込み生成専用に設計
テキスト埋め込み Transformers
B
buetnlpbio
364
1
Dictalm2 It Qa Fine Tune
Apache-2.0
これはDicta - ILのdictalm2.0 - instructモデルの微調整バージョンで、ヘブライ語の質問と回答のペアを生成するために特化しています。
質問応答システム Transformers その他
D
618AI
2,900
6
Sat 12l Sm
MIT
12層Transformerアーキテクチャに基づく先進的な文分割モデルで、多言語テキスト分割タスクをサポート
シーケンスラベリング Transformers 複数言語対応
S
segment-any-text
31.44k
20
Real3d
MIT
Real3DはTripoSRアーキテクチャに基づく2Dから3DへのマッピングTransformerモデルで、教師なし自己学習と自動データ選別により実世界画像の処理能力を拡張しています。
3Dビジョン
R
hwjiang
22
19
Meshanything
MeshAnythingは自己回帰型Transformerを基にしたアーティスト級のメッシュ生成モデルで、画像やポイントクラウドを高品質な3Dメッシュモデルに変換できます。
3Dビジョン
M
Yiwen-ntu
193
14
Dab Detr Resnet 50
Apache-2.0
DAB-DETRは改良されたDETR物体検出モデルで、動的アンカーボックス検索メカニズムによりトレーニング収束速度と検出精度を大幅に向上
物体検出 Transformers 英語
D
IDEA-Research
1,590
2
Block Diagram Global Information
Donutフレームワークに基づくTransformerアーキテクチャモデルで、ブロック図画像から全体の要約情報を抽出し、英語と韓国語の処理をサポートします。
画像生成テキスト Transformers 複数言語対応
B
shreyanshu09
19
2
Codontransformer
Apache-2.0
コドン最適化の究極ツールで、タンパク質配列を対象生物種に最適化されたDNA配列に変換できます。
タンパク質モデル Transformers
C
adibvafa
1,327
7
Medsam Breast Cancer
Transformersライブラリに基づく画像セグメンテーションモデルで、視覚タスクにおける画像分割処理に使用されます
画像セグメンテーション Transformers その他
M
MichaelSoloveitchik
61
0
Rtdetr R18vd
Apache-2.0
RT-DETRは初のリアルタイムエンドツーエンド物体検出Transformerモデルで、効率的なハイブリッドエンコーダとクエリ選択メカニズムによりNMS不要の効率的な検出を実現
物体検出 Transformers 英語
R
PekingU
11.98k
4
Segformer B3 Fashion
その他
SegFormerアーキテクチャに基づくファッションアイテム画像分割モデルで、衣類やアクセサリーの識別と分割に特化
画像セグメンテーション Transformers
S
sayeed99
75.65k
21
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase