Swarmformer Small Ef
Apache-2.0
SwarmFormerは、階層的注意メカニズムと動的クラスタリング技術により長いシーケンス処理能力を最適化した効率的なシーケンスモデリングアーキテクチャです。
大規模言語モデル
Transformers

S
Mayank6255
15
2
Mamba 2.8b Hf
Mambaアーキテクチャに基づく28億パラメータの言語モデルで、HuggingFace Transformersライブラリと互換性あり
大規模言語モデル
Transformers

M
state-spaces
8,731
103
Lsg 4096 Sentence Similarity Spanish
Apache-2.0
これはhiiamsid/sentence_similarity_spanish_esの強化版で、LSGアテンションメカニズムを採用し、最大4096トークンの長いシーケンスを効率的に処理できます。
テキスト埋め込み
Transformers スペイン語

L
prudant
31
5
Funnel Kor Base
70GBの韓国語テキストデータセットで訓練されたFunnel-transformer基本モデルで、42000の小文字サブワード単位を使用
大規模言語モデル
Transformers 韓国語

F
kykim
475
1
おすすめAIモデル
Llama 3 Typhoon V1.5x 8b Instruct
タイ語専用に設計された80億パラメータの命令モデルで、GPT-3.5-turboに匹敵する性能を持ち、アプリケーションシナリオ、検索拡張生成、制限付き生成、推論タスクを最適化
大規模言語モデル
Transformers 複数言語対応

L
scb10x
3,269
16
Cadet Tiny
Openrail
Cadet-TinyはSODAデータセットでトレーニングされた超小型対話モデルで、エッジデバイス推論向けに設計されており、体積はCosmo-3Bモデルの約2%です。
対話システム
Transformers 英語

C
ToddGoldfarb
2,691
6
Roberta Base Chinese Extractive Qa
RoBERTaアーキテクチャに基づく中国語抽出型QAモデルで、与えられたテキストから回答を抽出するタスクに適しています。
質問応答システム 中国語
R
uer
2,694
98