Bamba 9B V1
Apache-2.0
Bamba-9BはMamba-2アーキテクチャに基づくデコーダ専用言語モデルで、2段階トレーニングを経ており、幅広いテキスト生成タスクに優れています。
大規模言語モデル
B
ibm-ai-platform
16.19k
35
Mamba 7b Rw
Apache-2.0
Mamba-7BはMambaアーキテクチャに基づく70億パラメータのモデルで、RefinedWebデータセットで複数回のトレーニング(1.2兆トークン)を受けています。Mambaは状態空間モデルで、自己注意機構を使用せず、さまざまな自然言語ベンチマークで優れた性能を発揮します。
大規模言語モデル
Safetensors 英語
M
TRI-ML
188
55
Tamil Llama 7b Instruct V0.2
これはLLaMA-2ベースの7Bパラメータタミル語インストラクトモデルで、英語とタミル語のバイリンガル処理をサポートします。
大規模言語モデル
Transformers 複数言語対応

T
abhinand
197
5
Robertalexpt Base
RoBERTaLexPT-baseは、LegalPTとCrawlPTコーパスで事前学習された、法律分野に特化したポルトガル語マスク言語モデルです。
大規模言語モデル
Transformers その他

R
eduagarcia
366
17
Indobert Base Uncased
MIT
IndoBERTは、インドネシア語に特化して最適化されたBERTモデルで、複数のインドネシア語NLPタスクで優れた性能を発揮します。
大規模言語モデル その他
I
indolem
26.35k
42
Bert Base Spanish Wwm Cased
BETOは大規模なスペイン語コーパスを基に訓練されたBERTモデルで、大文字小文字を区別するバージョンと区別しないバージョンがあり、様々なスペイン語NLPタスクに適しています。
大規模言語モデル スペイン語
B
dccuchile
61.43k
63
Bert Base Spanish Wwm Uncased
BETOは大規模なスペイン語コーパスを使って学習されたBERTモデルで、大文字小文字を区別するバージョンと区別しないバージョンの両方をサポートし、様々なスペイン語NLPタスクに適用できます。
大規模言語モデル スペイン語
B
dccuchile
231.26k
65
おすすめAIモデル
Llama 3 Typhoon V1.5x 8b Instruct
タイ語専用に設計された80億パラメータの命令モデルで、GPT-3.5-turboに匹敵する性能を持ち、アプリケーションシナリオ、検索拡張生成、制限付き生成、推論タスクを最適化
大規模言語モデル
Transformers 複数言語対応

L
scb10x
3,269
16
Cadet Tiny
Openrail
Cadet-TinyはSODAデータセットでトレーニングされた超小型対話モデルで、エッジデバイス推論向けに設計されており、体積はCosmo-3Bモデルの約2%です。
対話システム
Transformers 英語

C
ToddGoldfarb
2,691
6
Roberta Base Chinese Extractive Qa
RoBERTaアーキテクチャに基づく中国語抽出型QAモデルで、与えられたテキストから回答を抽出するタスクに適しています。
質問応答システム 中国語
R
uer
2,694
98