S

Summllama3 8B

DISLabによって開発
SummLlama3-8BはLlama3-8B-Instructを初期化したテキスト要約モデルで、大規模な要約フィードバックによるDPOトレーニングにより最適化され、忠実性、完全性、簡潔性に優れた性能を発揮します。
ダウンロード数 15
リリース時間 : 10/11/2024

モデル概要

人間の嗜好に合致したクロスドメインテキスト要約の生成に特化し、ニュース、医療、会議など7つのシナリオをサポート。Llama3-70BやGPT-4oを凌駕する性能。

モデル特徴

クロスドメイン最適化
ニュース/医療/会議など7分野をカバーし、対話型・非対話型テキストに対応
3指標のバランス
忠実性(0.98)、完全性(0.697)、簡潔性(0.959)で全面的にリード
効率的な推論
8Bパラメータ規模で70Bモデルを上回る性能を実現し、推論速度も高速
LLMフィードバックトレーニング
10万件以上の要約に対するLLM生成フィードバックを用いたDPOトレーニングにより、人手アノテーションコストを回避

モデル能力

マルチドメインテキスト要約
対話内容の凝縮
キー情報抽出
長文の構造化圧縮

使用事例

メディア業界
ニュースブリーフ生成
ニュースの核心的事実を自動抽出
イベントの流れを保持しつつテキスト量を70%削減
医療健康
診療記録要約
診療のキー情報を抽出
ベースライン比12%精度向上
企業オフィス
会議議事録生成
議論の要点と決議事項を自動要約
アクションアイテムを完全に捕捉し冗長情報なし
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase