L

Longalpaca 7b 32k Chinese

yuyijiongによって開発
Llama2ベースの中国語長文対話モデル、32kコンテキスト長をサポート、長文QAや要約などのタスクに適応
ダウンロード数 32
リリース時間 : 10/25/2023

モデル概要

LongLoraトレーニング技術を用いてllama2-chatモデルに位置補間を施した後ファインチューニング、優れた長文処理能力を備え、万字レベルの複数ドキュメント検索や論文要約をサポート

モデル特徴

超長文コンテキスト処理
位置補間技術によりコンテキストウィンドウを32k tokensに拡張、万字レベルの長文を処理可能
中国語最適化
中国語長文コマンドデータセットでファインチューニング、特に中国語長文処理能力を最適化
複数ドキュメントQA
複数の参照ドキュメントを同時処理し統合回答を生成可能
ストリーミング生成サポート
streaming-LLMと互換性あり、超長文コンテンツを生成可能

モデル能力

長文QA
複数ドキュメント情報統合
学術論文要約
中国語対話生成
長文コマンド理解

使用事例

学術研究
論文要約
長編学術論文の要点を要約
vcsumデータセットでrouge-Lスコア0.15166
情報検索
複数ドキュメントQA
複数の関連ドキュメントから情報を抽出し複雑な質問に回答
dureaderデータセットでrouge-Lスコア0.18369
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase