M

Mistrallite

AWSによって開発
MistralLiteはMistral-7B-v0.1をファインチューニングした言語モデルで、長文脈処理(最大32Kトークン)能力が強化されており、長文脈検索、テーマ要約、QAなどのシナリオに適しています。
ダウンロード数 61.78k
リリース時間 : 10/16/2023

モデル概要

MistralLiteは最適化された言語モデルで、改良型ローテーションポジションエンコーディングとスライディングウィンドウ技術により、長文脈処理能力が大幅に向上し、リソースが限られた高性能ニーズのシナリオに適しています。

モデル特徴

長文脈処理能力
最大32Kトークンの文脈長をサポートし、長文タスクのパフォーマンスを大幅に向上させます。
改良型ローテーションポジションエンコーディング
rope_theta = 1000000のパラメータ設定を採用し、長シーケンス処理を最適化します。
大規模スライディングウィンドウ
スライディングウィンドウサイズを16384に拡大し、長距離依存関係の捕捉能力を強化します。
効率的な展開
単一のAWS g5.2xインスタンスで展開可能で、リソースが限られたシナリオに適しています。

モデル能力

長文脈検索
テーマ要約
QAシステム
テキスト生成

使用事例

情報検索
長文書テーマ検索
13.7Kトークン長で98%の精度を維持するテーマ検索能力。
オリジナルモデル(8.3Kトークンで2%に低下)を大幅に上回る
行単位情報特定
長文書内で特定の行情報を正確に特定します。
12.6Kトークン時で精度60%(オリジナルモデル30%)
QAシステム
長文テキストQA
複雑な文脈を含むQAタスクを処理します。
テストセット精度が44.3%から64.4%に向上
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase