モデル選定

低リソースNLP

# 低リソースNLP

Neurobert Mini GGUF

boltuix/NeuroBERT-Miniを基にした静的量子化バージョン、エッジデバイス向けに最適化された小型BERTモデル

大規模言語モデル

Simplestories 30M

SimpleStoriesは説明可能性研究のために設計されたマイクロモデルファミリーで、SimpleStoriesデータセットでトレーニングされ、ストーリー生成タスクに特化しています。

テキスト生成

Safetensors 英語

Fewshot Xsum Bart

BART-largeベースの少数事例要約生成モデルで、XSUMデータセットの100サンプルで訓練され、要約タスクにおける少数事例学習の可能性を示しています。

テキスト生成

Tweety 7b Tatar V24a

タタール語向けに開発されたクロストークン大規模言語モデル、Mistral-7B-Instruct-v0.2を基に変換

大規模言語モデル

Transformers その他

Tiroberta Abusiveness Detection

TiRoBERTaをファインチューニングしたティグリニャ語の侮辱的コンテンツ検出モデルで、13,717件のYouTubeコメントデータセットで訓練

テキスト分類

Website Classification

DistilBERTベースのウェブサイト分類モデルで、微調整により未知のデータセットで95.04%の正確率を達成しました。

テキスト分類

Afrolm Active Learning

AfroLMは23のアフリカ言語に最適化された事前学習言語モデルで、能動学習フレームワークを採用し、少量のデータで高性能を実現

大規模言語モデル

Transformers その他

Banglabert Finetuned Squad

このモデルはベンガル語SQuADデータセットでBanglaBERTをファインチューニングしたバージョンで、QAタスク用です

質問応答システム

Electra Large Generator

ELECTRAは、従来の生成型事前学習を判別型事前学習で置き換えることで、計算効率を大幅に向上させた効率的な自己教師あり言語表現学習手法です。

大規模言語モデル英語

Roberta Base 100M 3

1Mから1Bトークン規模のデータセットで事前学習されたRoBERTaバリアントで、BASEとMED-SMALLの2つの仕様があり、リソースが限られた場面での自然言語処理タスクに適しています

大規模言語モデル

Albert Large V2 Finetuned Rte

このモデルは、ALBERT-large-v2をベースにGLUE RTEタスクで微調整されたテキスト分類モデルで、テキストの含意関係を識別するために使用されます。

テキスト分類

Roberta Base 10M 1

異なる規模のデータセット(1M-1Bトークン)で事前学習されたRoBERTaシリーズモデルで、BASEとMED-SMALLの2種類の仕様を含む

大規模言語モデル

IndicBARTはインドの言語と英語に特化した多言語シーケンス・ツー・シーケンス事前学習モデルで、11のインド言語をサポートし、mBARTアーキテクチャに基づいて構築されています。

大規模言語モデル

Transformers その他

Tiny Roberta Indonesia

これはインドネシア語に特化した小型RoBERTaモデルで、インドネシア語テキスト処理タスク向けに最適化されています。

大規模言語モデル

Transformers その他

Roberta Base 100M 1

10億トークンスケールで事前学習されたRoBERTaベースモデル、検証パープレキシティは3.93、英語テキスト処理タスクに適しています。

大規模言語モデル

おすすめAIモデル

Llama 3 Typhoon V1.5x 8b Instruct

タイ語専用に設計された80億パラメータの命令モデルで、GPT-3.5-turboに匹敵する性能を持ち、アプリケーションシナリオ、検索拡張生成、制限付き生成、推論タスクを最適化

大規模言語モデル

Transformers 複数言語対応

Cadet-TinyはSODAデータセットでトレーニングされた超小型対話モデルで、エッジデバイス推論向けに設計されており、体積はCosmo-3Bモデルの約2％です。

対話システム

Transformers 英語

Roberta Base Chinese Extractive Qa

RoBERTaアーキテクチャに基づく中国語抽出型QAモデルで、与えられたテキストから回答を抽出するタスクに適しています。

質問応答システム中国語

AIbase

未来を切り開く、あなたのAIソリューション知識ベース

English 简体中文繁體中文にほんご

© 2025AIbase