モデル選定

事前学習言語モデル

# 事前学習言語モデル

Trendyolによって事前学習されたトルコ語Bertモデルで、様々な自然言語理解タスクに適しています。

大規模言語モデル

Transformers その他

Chronos T5 Mini

Chronosは言語モデルアーキテクチャに基づく事前学習済み時系列予測モデルファミリーで、時系列データをトークン系列に変換して学習し、確率的予測をサポートします。

気候モデル

Glot500は、500種類以上の言語をサポートする多言語事前学習モデルで、マスク言語モデリング（MLM）の目標に基づいて学習されています。

大規模言語モデル

Japanese Gpt Neox 3.6b

36億パラメータを持つ日本語GPT-NeoXモデルで、Transformerアーキテクチャに基づき、3.125兆トークンの日本語コーパスで学習されています。

大規模言語モデル

Transformers 複数言語対応

Hoogberta NER Lst20

タイ語固有表現認識タスク向けに微調整された事前学習言語モデル、LST20データセットに基づく

シーケンスラベリング

Transformers その他

Clinicalt5 Base

ClinicalT5はT5アーキテクチャに基づく生成型言語モデルで、臨床テキスト処理に特化して事前学習されており、医療分野の自然言語処理タスクに適しています。

大規模言語モデル

Italian Legal BERT

イタリア語XXL BERTモデルを基盤とし、国家司法アーカイブ3.7GBの前処理済みテキストで追加事前訓練を行った法分野特化モデル

大規模言語モデル

Transformers その他

哪吒(NEZHA)は中国語理解向けの神経コンテキスト化表現モデルで、Transformerアーキテクチャに基づき、Huawei Noah's Ark Labによって開発されました。

大規模言語モデル

Vihealthbert Base Word

ViHealthBERTはベトナム語の健康テキストマイニング向けの事前学習言語モデルで、医療健康分野で強力なベースライン性能を提供します

大規模言語モデル

Distil Slovakbert

これはRoBERTaアーキテクチャに基づくスロバキア語マスクフィリングモデルで、スロバキア語テキストタスクの処理に適しています。

大規模言語モデル

Transformers その他

Bert Base Portuguese Cased

ブラジルポルトガル語向けの事前学習BERTモデルで、複数のNLPタスクにおいて最先端の性能を達成

大規模言語モデルその他

Longformer Base Plagiarism Detection

このモデルはLongformerアーキテクチャを使用して訓練され、機械による改竄された不正コピーテキストの検出に特化しており、学術的誠実性の維持において重要な応用価値を持っています。

テキスト分類

Transformers 英語

Gpt2 Chinese Ancient

文言文テキスト生成に特化したGPT2モデルで、300万件の文言文データを基に事前学習されています。

大規模言語モデル中国語

Tcr Bert Mlm Only

TCR-BERTはBERTアーキテクチャに基づく事前学習モデルで、T細胞受容体（TCR）配列に特化して最適化されており、マスクアミノ酸モデリングタスクを通じて訓練されています。

タンパク質モデル

KoGPT2はHuggingface Transformersフレームワークに基づく韓国語生成事前学習モデルで、SKT - AIによって開発されオープンソース化されました。

大規模言語モデル

Araelectra Base Artydiqa

AraELECTRAに基づくアラビア語ウィキペディア質問応答システムで、アラビア語読解タスク用に設計されています。

質問応答システム

Transformers アラビア語

FinancialBERTは大量の金融テキストで事前学習されたBERTモデルで、金融分野の自然言語処理の研究と実践を推進することを目的としています。

大規模言語モデル

Transformers 英語

HeBERTはヘブライ語に基づく事前学習言語モデルで、BERTアーキテクチャを採用し、極性分析と感情識別タスクに特化しています。

大規模言語モデル

Bros Base Uncased

BROSは、テキストと版面レイアウトに特化した事前学習言語モデルで、文書から効率的に重要情報を抽出することを目的としています。

大規模言語モデル

naver-clova-ocr

Chinese Bert Wwm

全単語マスキング戦略を採用した中国語事前学習BERTモデルで、中国語自然言語処理研究を加速することを目的としています。

大規模言語モデル中国語

KoBARTはBARTアーキテクチャに基づく韓国語事前学習モデルで、様々な韓国語自然言語処理タスクに適用できます。

大規模言語モデル

Transformers 韓国語

Biosyn Sapbert Ncbi Disease

韓国大学のDmis-labによって開発されたBioBERTベースの生物医学実体認識モデルで、NCBI疾患データセットの特徴抽出タスクに特化しています。

テキスト埋め込み

これはGPT - 2アーキテクチャに基づくドイツ語言語モデルで、ドイツ語テキスト生成タスクに特化して最適化されています。

大規模言語モデルドイツ語

anonymous-german-nlp

Multi Dialect Bert Base Arabic

Arabic-BERTを初期化し、1000万件のアラビア語ツイートで学習した多方言BERTモデルで、アラビア語の複数の方言識別をサポートします。

大規模言語モデルアラビア語

Chinese Bigbird Base 4096

BigBirdアーキテクチャに基づく中国語事前学習モデル、4096長のコンテキスト処理をサポート

大規模言語モデル

Transformers 中国語

NepaliBERTは、BERTアーキテクチャに基づく高度なネパール語言語モデルで、マスク言語モデリング（MLM）手法を用いて訓練されています。

大規模言語モデル

ParsGPT2はペルシア語版のGPT - 2モデルで、Hooshvareチームによって開発され、ペルシア語テキスト生成タスクに使用されます。

大規模言語モデルその他

Bert Base Arabic Camelbert Ca

CAMeLBERTはアラビア語のバリエーションに最適化されたBERTモデルのセットで、CAバージョンは古典アラビア語テキストに特化して事前学習されています。

大規模言語モデルアラビア語

おすすめAIモデル

Llama 3 Typhoon V1.5x 8b Instruct

タイ語専用に設計された80億パラメータの命令モデルで、GPT-3.5-turboに匹敵する性能を持ち、アプリケーションシナリオ、検索拡張生成、制限付き生成、推論タスクを最適化

大規模言語モデル

Transformers 複数言語対応

Cadet-TinyはSODAデータセットでトレーニングされた超小型対話モデルで、エッジデバイス推論向けに設計されており、体積はCosmo-3Bモデルの約2％です。

対話システム

Transformers 英語

Roberta Base Chinese Extractive Qa

RoBERTaアーキテクチャに基づく中国語抽出型QAモデルで、与えられたテキストから回答を抽出するタスクに適しています。

質問応答システム中国語

AIbase

未来を切り開く、あなたのAIソリューション知識ベース

English 简体中文繁體中文にほんご

© 2025AIbase