L

Llama 3 8B Fixed Special Embedding

imoneによって開発
これはLlama 3 8Bベースモデルの修正版で、元のモデルで特殊トークンの重みがゼロによるNaN勾配問題を解決しました。
ダウンロード数 144
リリース時間 : 4/21/2024

モデル概要

このモデルはMetaがリリースしたLlama 3シリーズの80億パラメータ版で、特殊トークンの重みを再初期化処理し、トレーニングの安定性を向上させました。

モデル特徴

特殊トークン修正
<|eot_id|>などの特殊トークンの重みを再初期化し、元のモデルで発生する可能性のあるNaN勾配問題を解決
効率的な推論
8Bパラメータ規模で良好な性能を維持しながら比較的高効率な推論を実現
対話最適化
対話関連の特殊トークンを含み、対話システム構築に適している

モデル能力

テキスト生成
対話システム構築
テキスト理解
指示追従

使用事例

対話システム
インテリジェントアシスタント
ユーザーのリクエストを理解し応答する対話アシスタントの構築
一貫性があり関連性のある対話応答を生成可能
コンテンツ生成
クリエイティブライティング
ストーリー創作、詩作などのクリエイティブタスクの補助
創造性のある一貫性のあるテキストを生成
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase