モデル選定

ウィキペディアコーパス

# ウィキペディアコーパス

Multilingual Albert Base Cased 128k

マスク言語モデリング(MLM)目標で事前学習された多言語ALBERTモデルで、60種以上の言語をサポートし、パラメータ共有の軽量アーキテクチャを持つ

大規模言語モデル

Transformers 複数言語対応

Multilingual Albert Base Cased 32k

マスク言語モデリングの目的で事前学習された多言語ALBERTモデルで、50種以上の言語をサポートし、大文字小文字を区別します。

大規模言語モデル

Transformers 複数言語対応

Electra Small Japanese Generator

日本語ウィキペディアで事前学習されたELECTRAモデルで、日本語テキスト処理タスクに適しています。

大規模言語モデル

Transformers 日本語

Bert Base Arabic

現代標準アラビア語と一部の方言をサポートする事前学習済みアラビア語BERTベース言語モデル

大規模言語モデルアラビア語

Gpt2 Small Indonesian 522M

これはインドネシア語ウィキペディアデータで事前学習されたGPT2-smallモデルで、インドネシア語テキスト生成タスクに特化しています。

大規模言語モデルその他

Gpt2 Small Arabic

gpt2-smallアーキテクチャでトレーニングされたアラビア語ウィキペディアデータセットのGPT2モデルで、テキスト生成タスクに適しています。

大規模言語モデルアラビア語

Bert Base Indonesian 522M

インドネシア語ウィキペディアで事前学習されたBERTベースモデルで、マスク言語モデリング（MLM）目標で訓練されており、大文字小文字を区別しません。

大規模言語モデルその他

Wangchanberta Base Wiki Newmm

タイ語ウィキペディアで事前学習されたRoBERTa BASEモデルで、タイ語テキスト処理タスクに適しています。

大規模言語モデルその他

スロバキア語で訓練された事前学習モデルで、マスク言語モデリング（MLM）の目標を採用し、大文字と小文字を区別します。

大規模言語モデル

Transformers その他

Tinybert General 4L 312D De

これはドイツ語に最適化されたTinyBERTモデルで、BERTベースケースドモデルから蒸留により作成され、自然言語処理タスクに適しています。

大規模言語モデル

Transformers ドイツ語

Bert Base En Tr Cased

bert-base-multilingual-casedを基にカスタマイズした簡素化バージョンで、英語とトルコ語の処理をサポートし、元のモデルの精度を維持

大規模言語モデルその他

Bert Base Japanese Upos

日本語ウィキペディアテキストで事前学習されたBERTモデル、品詞タグ付けと依存構文解析用

シーケンスラベリング

Transformers 複数言語対応

おすすめAIモデル

Llama 3 Typhoon V1.5x 8b Instruct

タイ語専用に設計された80億パラメータの命令モデルで、GPT-3.5-turboに匹敵する性能を持ち、アプリケーションシナリオ、検索拡張生成、制限付き生成、推論タスクを最適化

大規模言語モデル

Transformers 複数言語対応

Cadet-TinyはSODAデータセットでトレーニングされた超小型対話モデルで、エッジデバイス推論向けに設計されており、体積はCosmo-3Bモデルの約2％です。

対話システム

Transformers 英語

Roberta Base Chinese Extractive Qa

RoBERTaアーキテクチャに基づく中国語抽出型QAモデルで、与えられたテキストから回答を抽出するタスクに適しています。

質問応答システム中国語

AIbase

未来を切り開く、あなたのAIソリューション知識ベース

English 简体中文繁體中文にほんご

© 2025AIbase