Llama2-22bオープンソースAIモデル - 融合した強みを微調整最適化し、より安定した使用体験をもたらす

ホーム

Llama2 22b

chargoddardによって開発

Llama 2 13Bをベースにした改良版で、オリジナルLlama 33Bの一部アテンションヘッドメカニズムを統合し、RedPajamaデータセットによるファインチューニングで安定性を向上

大規模言語モデル

Transformers

#混合アテンションヘッドメカニズム #RedPajamaファインチューニング #知識推論強化

ダウンロード数 90

リリース時間 : 7/22/2023

モデル概要

これは強化版の大規模言語モデルで、Llama 2 13BとオリジナルLlama 33Bの利点を組み合わせ、さらなるチューニングの基礎プラットフォームとして設計

モデル特徴

ハイブリッドアーキテクチャ

Llama 2 13BとオリジナルLlama 33Bのアテンションメカニズムを組み合わせ

安定したファインチューニング

RedPajama約1000万トークンのファインチューニングにより移植構造をより安定化

拡張ベース

チューニング基礎プラットフォームとして設計され、13Bバージョンより強力な学習能力が期待

モデル能力

テキスト生成

言語理解

知識質問応答

使用事例

研究開発

モデルチューニング基盤

さらなるチューニングの基礎モデルとして使用

13Bバージョンより強力な学習能力が期待

自然言語処理

テキスト生成

一貫性のあるテキストコンテンツを生成

指標	値
平均	46.85
ARC (25-shot)	58.53
HellaSwag (10-shot)	82.55
MMLU (5-shot)	54.68
TruthfulQA (0-shot)	39.84
Winogrande (5-shot)	76.32
GSM8K (5-shot)	9.93
DROP (3-shot)	6.08

属性	詳細
モデルタイプ	llama
パイプラインタグ	テキスト生成
データセット	togethercomputer/RedPajama-Data-1T-Sample
タグ	llama

おすすめAIモデル

Llama 3 Typhoon V1.5x 8b Instruct

タイ語専用に設計された80億パラメータの命令モデルで、GPT-3.5-turboに匹敵する性能を持ち、アプリケーションシナリオ、検索拡張生成、制限付き生成、推論タスクを最適化

Cadet-TinyはSODAデータセットでトレーニングされた超小型対話モデルで、エッジデバイス推論向けに設計されており、体積はCosmo-3Bモデルの約2％です。

Roberta Base Chinese Extractive Qa

RoBERTaアーキテクチャに基づく中国語抽出型QAモデルで、与えられたテキストから回答を抽出するタスクに適しています。

質問応答システム中国語

uer

2,694

未来を切り開く、あなたのAIソリューション知識ベース

English 简体中文繁體中文にほんご

Llama2 22b

モデル概要

モデル特徴

モデル能力

使用事例

🚀 Llama 2 13b改良モデル

🚀 クイックスタート

📚 ドキュメント

Open LLM Leaderboard評価結果

モデル情報