Turkish Base Bert Uncased
これはトルコ語用の基礎版BERTモデルで、大文字小文字を区別せず、主にマスク埋めタスクに使用されます。
大規模言語モデル
Transformers その他

T
ytu-ce-cosmos
241
16
Roberta Small Greek
これはRoBERTaアーキテクチャに基づく小型のギリシャ語言語モデルで、パラメータ規模はベースモデルの約半分で、ギリシャ語テキストのマスク埋め込みタスクに適しています。
大規模言語モデル
Transformers その他

R
ClassCat
22
2
Bert Base Indonesian 1.5G
MIT
これはBERTに基づくインドネシア語の事前学習モデルで、ウィキペディアと新聞データを使って学習され、様々な自然言語処理タスクに適しています。
大規模言語モデル その他
B
cahya
40.08k
5
Indobert Large P2
MIT
IndoBERTは、BERTモデルをベースにインドネシア語向けに開発された最先端の言語モデルで、マスク言語モデリング(MLM)と次文予測(NSP)の目標で学習されています。
大規模言語モデル その他
I
indobenchmark
2,272
8
Small
Apache-2.0
英語コーパスで事前学習されたTransformerモデルで、ELECTRAに似た目的で学習され、テキスト特徴抽出と下流タスクの微調整に適しています。
大規模言語モデル
Transformers 英語

S
funnel-transformer
6,084
5
Kinyaroberta Small
これはキニャルワンダ語のデータセットに基づき、マスク言語モデリング(MLM)の目標で事前学習されたRoBERTaモデルで、大文字小文字の区別のないトークンを使用して事前学習されています。
大規模言語モデル
Transformers

K
jean-paul
38
0
Ruperta Base
RuPERTaは、大型のスペイン語コーパスを使って訓練された大文字小文字の区別のないRoBERTaモデルで、RoBERTaの改良された事前学習方法を採用しており、様々なスペイン語のNLPタスクに適しています。
大規模言語モデル スペイン語
R
mrm8488
39
2
Roberta Base Indonesian 522M
MIT
RoBERTa-baseアーキテクチャに基づくインドネシア語の事前学習モデルで、インドネシア語のウィキペディアデータを使用して学習され、大文字小文字を区別しません。
大規模言語モデル その他
R
cahya
454
6
Sbert Uncased Finnish Paraphrase
FinBERTをベースに訓練されたフィンランド語の文のBERTモデルで、文の類似度計算と特徴抽出に使用されます。
テキスト埋め込み
Transformers その他

S
TurkuNLP
895
2
Indobert Lite Base P2
MIT
IndoBERTはインドネシア語向けに開発されたトップクラスの言語モデルで、BERTアーキテクチャに基づき、マスク言語モデリングと次文予測の目標を用いて訓練されています。
大規模言語モデル
Transformers その他

I
indobenchmark
2,498
0
Indobert Lite Large P1
MIT
IndoBERTはインドネシア語用の先進的な言語モデルで、BERTアーキテクチャに基づき、マスク言語モデリングと次文予測の目的で訓練されています。
大規模言語モデル
Transformers その他

I
indobenchmark
42
0
Danish Bert Botxo
Certainly(旧BotXO)によって開発されたデンマーク語BERTモデルで、大文字小文字の区別なしのデンマーク語テキスト処理をサポートします。
大規模言語モデル その他
D
Maltehb
1,306
14
Danish Bert Botxo Ner Dane
これはデンマーク語用に事前学習されたBERTモデルで、Certainly(旧BotXO)によって開発され、その後Malte Højmark - BertelsenによってDaNEデータセット上で命名エンティティ認識タスクに対して微調整されました。
シーケンスラベリング その他
D
Maltehb
594
4
おすすめAIモデル
Llama 3 Typhoon V1.5x 8b Instruct
タイ語専用に設計された80億パラメータの命令モデルで、GPT-3.5-turboに匹敵する性能を持ち、アプリケーションシナリオ、検索拡張生成、制限付き生成、推論タスクを最適化
大規模言語モデル
Transformers 複数言語対応

L
scb10x
3,269
16
Cadet Tiny
Openrail
Cadet-TinyはSODAデータセットでトレーニングされた超小型対話モデルで、エッジデバイス推論向けに設計されており、体積はCosmo-3Bモデルの約2%です。
対話システム
Transformers 英語

C
ToddGoldfarb
2,691
6
Roberta Base Chinese Extractive Qa
RoBERTaアーキテクチャに基づく中国語抽出型QAモデルで、与えられたテキストから回答を抽出するタスクに適しています。
質問応答システム 中国語
R
uer
2,694
98