L

Longchat 13b 16k

lmsysによって開発
llama-13bを微調整したオープンソースのチャットボットで、16kのコンテキスト長をサポートし、ShareGPTプラットフォームのユーザーが共有した対話からトレーニングデータを取得
ダウンロード数 14.21k
リリース時間 : 6/28/2023

モデル概要

longchat-13b-16kはオープンソースのチャットボットモデルで、主に研究目的に使用され、特に長文対話シナリオの処理に適しています。

モデル特徴

長文コンテキストサポート
16kトークンのコンテキスト長をサポートし、長い対話シナリオの処理に適しています
圧縮回転位置埋め込み
特殊な位置符号化技術を採用し、長文処理能力を強化
オープンソースで微調整可能
オープンソースのLLaMAアーキテクチャをベースに、さらなる微調整をサポート

モデル能力

長文対話生成
マルチターン対話理解
オープンドメインQA

使用事例

研究応用
長文対話システム研究
長文コンテキスト対話システムの性能と能力を研究するために使用
位置符号化技術研究
圧縮回転位置埋め込みが長文処理においてどのような効果をもたらすかを研究
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase