モデル選定

128K長テキスト処理

# 128K長テキスト処理

Phi 3.5 Mini Instruct

Phi-3.5-mini-instructは、Phi-3で使用されるデータセットに基づいて構築された、軽量で先進的なオープンソースモデルです。高品質で推論に富んだデータに焦点を当てています。128Kトークンのコンテキスト長をサポートし、強力な多言語能力と長いコンテキスト処理能力を備えています。

大規模言語モデル

Transformers その他

Typhoon2.1 Gemma3 4b Gguf

Typhoon2.1-Gemma3-4Bは命令型のタイ語大規模言語モデルで、40億のパラメータと128Kのコンテキスト長を持ち、関数呼び出し機能をサポートしています。

大規模言語モデル

Qwen2.5 7B Instruct

Qwen2.5は通義大規模言語モデルの最新シリーズで、5億から720億のパラメータを持つ様々なモデルを提供し、コーディング、数学、命令遵守、長テキスト処理において顕著な改善が見られます。

大規模言語モデル

Transformers 複数言語対応

Gemma 3 1b It Qat

Gemma 3はGoogleが開発した軽量マルチモーダルモデルで、テキストと画像の入力を処理し、テキスト出力を生成することができます。このモデルは128Kの大きなコンテキストウィンドウと140種類以上の言語のマルチ言語サポートを備えています。

画像生成テキスト

C4ai Command R Plus 4bit

Cohere Labs Command R+ は1040億パラメータの多言語大規模言語モデルで、検索強化生成（RAG）やツール使用などの高度な機能を備え、128Kのコンテキスト長をサポートします。

大規模言語モデル

Transformers 複数言語対応

Buddhi 128k Chat 7b

Buddhi-128k-Chatは、128Kのコンテキストウィンドウを持つ汎用の最初のチャットモデルです。Mistral 7B Instructを基に細かく微調整され、革新的なYaRN技術で最適化されており、最大128,000トークンの拡張コンテキスト長を処理できます。

大規模言語モデル

Transformers 英語

おすすめAIモデル

Llama 3 Typhoon V1.5x 8b Instruct

タイ語専用に設計された80億パラメータの命令モデルで、GPT-3.5-turboに匹敵する性能を持ち、アプリケーションシナリオ、検索拡張生成、制限付き生成、推論タスクを最適化

大規模言語モデル

Transformers 複数言語対応

Cadet-TinyはSODAデータセットでトレーニングされた超小型対話モデルで、エッジデバイス推論向けに設計されており、体積はCosmo-3Bモデルの約2％です。

対話システム

Transformers 英語

Roberta Base Chinese Extractive Qa

RoBERTaアーキテクチャに基づく中国語抽出型QAモデルで、与えられたテキストから回答を抽出するタスクに適しています。

質問応答システム中国語

AIbase

未来を切り開く、あなたのAIソリューション知識ベース

English 简体中文繁體中文にほんご

© 2025AIbase