L

Llama 3 70B Special Tokens Adjusted

astronomerによって開発
Meta-Llama-3-70Bをベースに最適化された特殊タグ調整バージョンで、元のモデルで未学習の特殊タグに起因する微調整の問題を解消しました。
ダウンロード数 33
リリース時間 : 4/25/2024

モデル概要

このモデルはMeta-Llama-3-70Bの最適化バージョンで、主に元のモデルで一部の特殊タグが学習されていない問題を解決し、モデルを下流タスクの微調整により適したものにします。

モデル特徴

特殊タグの最適化
元のモデルで未学習の特殊タグの問題を解消し、学習済みタグの平均値でこれらのタグの重みを埋めます。
微調整の安定性向上
微調整中に発生する可能性のある勾配爆発またはNaN勾配の問題を解決します。
互換性の維持
元のMeta-Llama-3-70Bモデルとまったく同じ機能を維持し、特殊タグの処理のみを最適化します。

モデル能力

テキスト生成
命令追従
下流タスクの微調整

使用事例

自然言語処理
命令微調整
ベースモデルとして命令微調整を行う
特殊タグの問題による学習の不安定性を回避する
新しいタグの追加
微調整中に新しいタグを追加する
新しいタグが合理的な初期埋め込み値を取得できる
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase