Turkish Deepseek
Apache-2.0
DeepSeekアーキテクチャに基づき、トルコ語テキストで訓練された言語モデルで、マルチヘッド潜在的注意(MLA)と専家混合(MoE)技術を含んでいます。
大規模言語モデル
Transformers その他

T
alibayram
106
1
Clinical T5
Apache-2.0
これはT5-smallモデルをファインチューニングした臨床ノート要約モデルで、主に臨床ノートの要約生成に使用されます。
テキスト生成
Transformers 英語

C
hossboll
589
0
Deberta V3 Small Finetuned Mnli
MIT
GLUE MNLIデータセットで微調整されたDeBERTa v3の小規模バージョンで、自然言語推論タスクに使用され、正解率は87.46%に達します。
テキスト分類
Transformers 英語

D
mrm8488
139
3
2chan Rugpt3 Small
ruGPT3-small は2chanの投稿の一部でトレーニングされた小型ロシア語言語モデルで、テキスト生成タスクに適しています。
大規模言語モデル
2
TheBakerCat
20
0
Legal T5 Small Trans Cs Sv
チェコ語の法律テキストをスウェーデン語に翻訳するための小型T5モデル
機械翻訳
L
SEBIS
17
0
Legal T5 Small Trans Es En Small Finetuned
このモデルは、法律テキストをスペイン語から英語に翻訳するために使用され、T5-smallアーキテクチャに基づいて最適化訓練されています。
機械翻訳
L
SEBIS
44
0
Sroberta L
Apache-2.0
クロアチア語とセルビア語を基に訓練されたRoBERTa言語モデルで、6GBのデータセットを使って50万ステップ訓練されました。
大規模言語モデル
Transformers その他

S
Andrija
17
0
おすすめAIモデル
Llama 3 Typhoon V1.5x 8b Instruct
タイ語専用に設計された80億パラメータの命令モデルで、GPT-3.5-turboに匹敵する性能を持ち、アプリケーションシナリオ、検索拡張生成、制限付き生成、推論タスクを最適化
大規模言語モデル
Transformers 複数言語対応

L
scb10x
3,269
16
Cadet Tiny
Openrail
Cadet-TinyはSODAデータセットでトレーニングされた超小型対話モデルで、エッジデバイス推論向けに設計されており、体積はCosmo-3Bモデルの約2%です。
対話システム
Transformers 英語

C
ToddGoldfarb
2,691
6
Roberta Base Chinese Extractive Qa
RoBERTaアーキテクチャに基づく中国語抽出型QAモデルで、与えられたテキストから回答を抽出するタスクに適しています。
質問応答システム 中国語
R
uer
2,694
98