S

SIMS Llama3.2 3B

slprlによって開発
このモデルはLlama-3.2-3Bをファインチューニングした音声言語モデルで、交互音声-テキストSLMの拡張性分析に特化し、音声とテキストの生成タスクをサポートします。
ダウンロード数 54
リリース時間 : 4/2/2025

モデル概要

これは音声言語モデル(SLM)で、与えられた音声-テキストプロンプトに基づき、離散的なHubertトークンから音声またはテキストの継続を生成します。

モデル特徴

効率的な拡張性
交互音声-テキスト初期化により、純粋な音声SLMと比べて計算拡張効率が大幅に向上しました。
知識転移
事前学習済みテキスト言語モデル(TextLM)からの初期化により、知識転移を実現し、モデル性能を向上させました。
マルチモーダルサポート
音声とテキストの生成タスクをサポートし、音声プロンプトからテキスト継続を生成するなどのクロスモーダルタスクを処理できます。

モデル能力

音声生成
テキスト生成
クロスモーダルタスク処理

使用事例

音声生成
音声フラグメント継続
与えられた音声プロンプトに基づいて音声フラグメントの継続を生成します。
クロスモーダルタスク
音声からテキスト生成
音声プロンプトに基づいてテキストの継続を生成します。
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase