Neurobert Mini GGUF
MIT
boltuix/NeuroBERT-Miniを基にした静的量子化バージョン、エッジデバイス向けに最適化された小型BERTモデル
大規模言語モデル
Transformers

N
mradermacher
219
2
Simplestories 30M
MIT
SimpleStoriesは説明可能性研究のために設計されたマイクロモデルファミリーで、SimpleStoriesデータセットでトレーニングされ、ストーリー生成タスクに特化しています。
テキスト生成
Safetensors 英語
S
SimpleStories
735
1
Fewshot Xsum Bart
MIT
BART-largeベースの少数事例要約生成モデルで、XSUMデータセットの100サンプルで訓練され、要約タスクにおける少数事例学習の可能性を示しています。
テキスト生成
F
bhargavis
19
1
Tweety 7b Tatar V24a
Apache-2.0
タタール語向けに開発されたクロストークン大規模言語モデル、Mistral-7B-Instruct-v0.2を基に変換
大規模言語モデル
Transformers その他

T
Tweeties
37
11
Tiroberta Abusiveness Detection
TiRoBERTaをファインチューニングしたティグリニャ語の侮辱的コンテンツ検出モデルで、13,717件のYouTubeコメントデータセットで訓練
テキスト分類
Transformers

T
fgaim
210
2
Website Classification
Apache-2.0
DistilBERTベースのウェブサイト分類モデルで、微調整により未知のデータセットで95.04%の正確率を達成しました。
テキスト分類
Transformers

W
alimazhar-110
3,844
37
Afrolm Active Learning
AfroLMは23のアフリカ言語に最適化された事前学習言語モデルで、能動学習フレームワークを採用し、少量のデータで高性能を実現
大規模言語モデル
Transformers その他

A
bonadossou
132
8
Banglabert Finetuned Squad
このモデルはベンガル語SQuADデータセットでBanglaBERTをファインチューニングしたバージョンで、QAタスク用です
質問応答システム
Transformers

B
Naimul
15
0
Electra Large Generator
Apache-2.0
ELECTRAは、従来の生成型事前学習を判別型事前学習で置き換えることで、計算効率を大幅に向上させた効率的な自己教師あり言語表現学習手法です。
大規模言語モデル 英語
E
google
473
8
Roberta Base 100M 3
1Mから1Bトークン規模のデータセットで事前学習されたRoBERTaバリアントで、BASEとMED-SMALLの2つの仕様があり、リソースが限られた場面での自然言語処理タスクに適しています
大規模言語モデル
R
nyu-mll
18
0
Albert Large V2 Finetuned Rte
Apache-2.0
このモデルは、ALBERT-large-v2をベースにGLUE RTEタスクで微調整されたテキスト分類モデルで、テキストの含意関係を識別するために使用されます。
テキスト分類
Transformers

A
anirudh21
22
0
Roberta Base 10M 1
異なる規模のデータセット(1M-1Bトークン)で事前学習されたRoBERTaシリーズモデルで、BASEとMED-SMALLの2種類の仕様を含む
大規模言語モデル
R
nyu-mll
13
1
Indicbart
IndicBARTはインドの言語と英語に特化した多言語シーケンス・ツー・シーケンス事前学習モデルで、11のインド言語をサポートし、mBARTアーキテクチャに基づいて構築されています。
大規模言語モデル
Transformers その他

I
ai4bharat
4,120
33
Tiny Roberta Indonesia
MIT
これはインドネシア語に特化した小型RoBERTaモデルで、インドネシア語テキスト処理タスク向けに最適化されています。
大規模言語モデル
Transformers その他

T
akahana
17
1
Roberta Base 100M 1
10億トークンスケールで事前学習されたRoBERTaベースモデル、検証パープレキシティは3.93、英語テキスト処理タスクに適しています。
大規模言語モデル
R
nyu-mll
63
0
おすすめAIモデル
Llama 3 Typhoon V1.5x 8b Instruct
タイ語専用に設計された80億パラメータの命令モデルで、GPT-3.5-turboに匹敵する性能を持ち、アプリケーションシナリオ、検索拡張生成、制限付き生成、推論タスクを最適化
大規模言語モデル
Transformers 複数言語対応

L
scb10x
3,269
16
Cadet Tiny
Openrail
Cadet-TinyはSODAデータセットでトレーニングされた超小型対話モデルで、エッジデバイス推論向けに設計されており、体積はCosmo-3Bモデルの約2%です。
対話システム
Transformers 英語

C
ToddGoldfarb
2,691
6
Roberta Base Chinese Extractive Qa
RoBERTaアーキテクチャに基づく中国語抽出型QAモデルで、与えられたテキストから回答を抽出するタスクに適しています。
質問応答システム 中国語
R
uer
2,694
98