Minicpm4 0.5B
Apache-2.0
MiniCPM4はエッジデバイス向けに設計された高効率大規模言語モデルで、システム革新によりモデルアーキテクチャ、学習データ、学習アルゴリズム、推論システムの4つの重要な次元で極限までの効率向上を実現しています。
大規模言語モデル
Transformers 複数言語対応

M
openbmb
415
20
Minicpm4 8B
Apache-2.0
MiniCPM4はエッジデバイス向けに設計された高効率大規模言語モデルで、システム革新によりモデルアーキテクチャ、学習データ、学習アルゴリズム、推論システムの4つの次元で極限までの効率向上を実現し、エッジチップ上で5倍以上の生成速度向上を達成します。
大規模言語モデル
Transformers 複数言語対応

M
openbmb
643
103
Reranker ModernBERT Large Gooaq Bce
Apache-2.0
これは、ModernBERT-largeから微調整されたクロスエンコーダモデルで、テキストペアのスコアを計算するために使用され、テキストの再ランキングと意味的検索タスクに適しています。
テキスト埋め込み 英語
R
tomaarsen
596
5
Reranker Msmarco ModernBERT Base Lambdaloss
Apache-2.0
これはModernBERT-baseから微調整されたクロスエンコーダモデルで、テキストペアのスコアを計算するために使用され、テキストの再ランキングと意味検索タスクに適しています。
テキスト埋め込み 英語
R
tomaarsen
89
4
Duo
Apache-2.0
DUOはTransformersライブラリに基づく事前学習モデルで、マスク言語モデリングタスクに特化しており、自然言語処理分野に適用されます。
大規模言語モデル
Transformers 英語

D
s-sahoo
212
1
Bge M3 Spa Law Qa
Apache-2.0
BAAI/bge-m3を微調整したスペイン語の文埋め込みモデルで、法律分野に特化して最適化されており、意味検索や情報検索タスクに適しています。
テキスト埋め込み スペイン語
B
littlejohn-ai
309
11
Mosaicml Mpt 7b Storywriter Bnb 4bit Smashed
PrunaAIが圧縮したMPT-7Bストーリーライティングモデル。llm-int8技術により高効率推論を実現
大規模言語モデル
Transformers その他

M
PrunaAI
27
1
Pegasus Multi News Headline
google/pegasus-multi_newsをファインチューニングしたニュースタイトル生成モデルで、複数文書入力から簡潔なタイトルを生成するのに優れています。
テキスト生成
Transformers

P
chinhon
18
3
Bart Large Cnn
MIT
英語コーパスで事前学習されたBARTモデルで、CNNデイリーメールデータセットに特化してファインチューニングされ、テキスト要約タスクに適しています。
テキスト生成 英語
B
facebook
3.8M
1,364
Roberta2roberta L 24 Discofuse
Apache-2.0
RoBERTaアーキテクチャに基づくエンコーダ - デコーダモデルで、文の融合タスク用に設計されています。
テキスト生成
Transformers 英語

R
google
102
2
Bigbird Roberta Natural Questions
Apache-2.0
BigBirdアーキテクチャに基づく質問応答モデルで、自然質問データセットに対して最適化された訓練を行っています。
質問応答システム
Transformers 英語

B
vasudevgupta
41
10
Bert Large Swedish Cased
Megatron-LMフレームワークに基づいて実装されたスウェーデン語Bert Largeモデルで、3億4000万のパラメータを含み、85GBのスウェーデン語テキストで事前学習されています。
大規模言語モデル
Transformers その他

B
AI-Nordics
734
11
Nb Gpt J 6B
Apache-2.0
GPT - J 6Bをベースにしたノルウェー語の微調整バージョンで、60億パラメータ規模のTransformerモデル
大規模言語モデル
Transformers その他

N
NbAiLab
479
20
Chinese Bigbird Wwm Base 4096
Apache-2.0
BigBirdアーキテクチャに基づく中国語の事前学習モデルで、全単語マスキング(WWM)戦略を採用し、4096の長さのコンテキストウィンドウをサポートします。
大規模言語モデル
Transformers 中国語

C
Lowin
13
3
T5 Liputan6 Finetuned Indonesia Summarization
これはAutoNLPを基に訓練されたインドネシア語要約生成モデルで、入力テキストの要約を自動生成することができます。
テキスト生成
Transformers その他

T
Radvian
186
0
Wenzhong GPT2 3.5B
Apache-2.0
自然言語生成タスクの処理に特化した、現在最大の中国語GPT2モデルです。
大規模言語モデル
Transformers 中国語

W
IDEA-CCNL
78
15
おすすめAIモデル
Llama 3 Typhoon V1.5x 8b Instruct
タイ語専用に設計された80億パラメータの命令モデルで、GPT-3.5-turboに匹敵する性能を持ち、アプリケーションシナリオ、検索拡張生成、制限付き生成、推論タスクを最適化
大規模言語モデル
Transformers 複数言語対応

L
scb10x
3,269
16
Cadet Tiny
Openrail
Cadet-TinyはSODAデータセットでトレーニングされた超小型対話モデルで、エッジデバイス推論向けに設計されており、体積はCosmo-3Bモデルの約2%です。
対話システム
Transformers 英語

C
ToddGoldfarb
2,691
6
Roberta Base Chinese Extractive Qa
RoBERTaアーキテクチャに基づく中国語抽出型QAモデルで、与えられたテキストから回答を抽出するタスクに適しています。
質問応答システム 中国語
R
uer
2,694
98