モデル選定

小規模パラメータ最適化

# 小規模パラメータ最適化

Turkish Deepseek

DeepSeekアーキテクチャに基づき、トルコ語テキストで訓練された言語モデルで、マルチヘッド潜在的注意(MLA)と専家混合(MoE)技術を含んでいます。

大規模言語モデル

Transformers その他

これはT5-smallモデルをファインチューニングした臨床ノート要約モデルで、主に臨床ノートの要約生成に使用されます。

テキスト生成

Transformers 英語

Deberta V3 Small Finetuned Mnli

GLUE MNLIデータセットで微調整されたDeBERTa v3の小規模バージョンで、自然言語推論タスクに使用され、正解率は87.46%に達します。

テキスト分類

Transformers 英語

2chan Rugpt3 Small

ruGPT3-small は2chanの投稿の一部でトレーニングされた小型ロシア語言語モデルで、テキスト生成タスクに適しています。

大規模言語モデル

Legal T5 Small Trans Cs Sv

チェコ語の法律テキストをスウェーデン語に翻訳するための小型T5モデル

Legal T5 Small Trans Es En Small Finetuned

このモデルは、法律テキストをスペイン語から英語に翻訳するために使用され、T5-smallアーキテクチャに基づいて最適化訓練されています。

クロアチア語とセルビア語を基に訓練されたRoBERTa言語モデルで、6GBのデータセットを使って50万ステップ訓練されました。

大規模言語モデル

Transformers その他

おすすめAIモデル

Llama 3 Typhoon V1.5x 8b Instruct

タイ語専用に設計された80億パラメータの命令モデルで、GPT-3.5-turboに匹敵する性能を持ち、アプリケーションシナリオ、検索拡張生成、制限付き生成、推論タスクを最適化

大規模言語モデル

Transformers 複数言語対応

Cadet-TinyはSODAデータセットでトレーニングされた超小型対話モデルで、エッジデバイス推論向けに設計されており、体積はCosmo-3Bモデルの約2％です。

対話システム

Transformers 英語

Roberta Base Chinese Extractive Qa

RoBERTaアーキテクチャに基づく中国語抽出型QAモデルで、与えられたテキストから回答を抽出するタスクに適しています。

質問応答システム中国語

AIbase

未来を切り開く、あなたのAIソリューション知識ベース

English 简体中文繁體中文にほんご

© 2025AIbase