Falcon H1 1.5B Instruct
その他
ファルコン-H1はTIIが開発した効率的なハイブリッドアーキテクチャの言語モデルで、TransformersとMambaアーキテクチャの利点を組み合わせ、英語と多言語タスクをサポートします。
大規模言語モデル
Transformers

F
tiiuae
1,022
4
Ring Lite Linear Preview
MIT
玲瓏線形プレビュー版はInclusionAIによってオープンソースで公開されたハイブリッド線形スパース大規模言語モデルで、総パラメータ数は17.1B、活性化パラメータ数は3.0Bです。このモデルはハイブリッド線形アテンションメカニズムに基づいて長文推論を実現し、推論プロセスにおいてほぼ線形の計算複雑性とほぼ一定の空間複雑性を持ちます。
大規模言語モデル 複数言語対応
R
inclusionAI
25
8
Kanana Nano 2.1b Embedding
KananaはKakaoが開発したバイリンガル(韓国語/英語)言語モデルシリーズで、韓国語タスクで優れた性能を発揮し、英語タスクでも競争力があり、同規模のモデルと比較して計算コストを大幅に削減しています。
大規模言語モデル
Transformers 複数言語対応

K
kakaocorp
7,722
20
Kanana Nano 2.1b Base
KananaはKakaoが開発したバイリンガル大規模言語モデルシリーズで、韓国語タスクで優れた性能を発揮し、英語タスクでも競争力を維持しています。2.1bバージョンはこのシリーズの軽量ベースモデルです。
大規模言語モデル
Transformers 複数言語対応

K
kakaocorp
4,039
33
Kanana Nano 2.1b Instruct
KananaはKakaoが開発したバイリンガル(韓国語/英語)言語モデルシリーズで、この2.1Bパラメータ版は韓国語性能で同規模モデルを上回りつつ、効率的な計算コストを維持しています。
大規模言語モデル
Transformers 複数言語対応

K
kakaocorp
5,994
59
Prosparse Llama 2 7b
LLaMA-2-7Bを基にした活性化スパース化大規模言語モデル、ProSparseメソッドにより高スパース率(89.32%)を実現しつつ元の性能を維持
大規模言語モデル
Transformers 英語

P
SparseLLM
152
15
Molm 700M 4B
Apache-2.0
MoLMは混合エキスパート(MoE)アーキテクチャに基づく言語モデルシリーズで、700M-4Bバージョンは総パラメータ数40億、計算コストは7億パラメータの密モデル相当
大規模言語モデル
Transformers

M
ibm-research
36
6
おすすめAIモデル
Llama 3 Typhoon V1.5x 8b Instruct
タイ語専用に設計された80億パラメータの命令モデルで、GPT-3.5-turboに匹敵する性能を持ち、アプリケーションシナリオ、検索拡張生成、制限付き生成、推論タスクを最適化
大規模言語モデル
Transformers 複数言語対応

L
scb10x
3,269
16
Cadet Tiny
Openrail
Cadet-TinyはSODAデータセットでトレーニングされた超小型対話モデルで、エッジデバイス推論向けに設計されており、体積はCosmo-3Bモデルの約2%です。
対話システム
Transformers 英語

C
ToddGoldfarb
2,691
6
Roberta Base Chinese Extractive Qa
RoBERTaアーキテクチャに基づく中国語抽出型QAモデルで、与えられたテキストから回答を抽出するタスクに適しています。
質問応答システム 中国語
R
uer
2,694
98