モデル選定

スライディングウィンドウアテンション

# スライディングウィンドウアテンション

Qwen1.5 Moe Tiny Random

これはQwen1.5-MoEアーキテクチャに基づくランダム初期化の小型モデルで、float16精度を採用し、テキスト生成タスクに適しています。

大規模言語モデル

H2o Danube 1.8b Base

H2O.aiがトレーニングした18億パラメータのベース言語モデルで、改良されたLlama 2アーキテクチャに基づき、16Kのコンテキスト長をサポート

大規模言語モデル

Transformers 英語

Mistral 7B Instruct V0.1

Mistral-7B-Instruct-v0.1は、Mistral-7B-v0.1生成テキストモデルを基に、複数の公開対話データセットで命令ファインチューニングを行ったバージョンです。

大規模言語モデル

Dinat Mini In1k 224

DiNAT-Miniは近傍アテンション機構に基づく階層型ビジョントランスフォーマーモデルで、画像分類タスク向けに設計されています。

Longformer Base 4096 Spanish

RoBERTaチェックポイントを基に開発されたスペイン語長文書処理モデル、4096トークンのシーケンス長をサポート

大規模言語モデル

Transformers スペイン語

おすすめAIモデル

Llama 3 Typhoon V1.5x 8b Instruct

タイ語専用に設計された80億パラメータの命令モデルで、GPT-3.5-turboに匹敵する性能を持ち、アプリケーションシナリオ、検索拡張生成、制限付き生成、推論タスクを最適化

大規模言語モデル

Transformers 複数言語対応

Cadet-TinyはSODAデータセットでトレーニングされた超小型対話モデルで、エッジデバイス推論向けに設計されており、体積はCosmo-3Bモデルの約2％です。

対話システム

Transformers 英語

Roberta Base Chinese Extractive Qa

RoBERTaアーキテクチャに基づく中国語抽出型QAモデルで、与えられたテキストから回答を抽出するタスクに適しています。

質問応答システム中国語

AIbase

未来を切り開く、あなたのAIソリューション知識ベース

English 简体中文繁體中文にほんご

© 2025AIbase