M

Mhubert Base 25hz

slprlによって開発
Meta社のHubertモデルのバージョンで、TWIST論文で提案され、SpeechLMsを訓練するための音声タグ付けツールとして重要な価値を示しています。
ダウンロード数 10.63k
リリース時間 : 10/24/2024

モデル概要

このHubertモデルは音声特徴抽出に使用され、音声言語モデリングや話し方変換などのシナリオに適しています。

モデル特徴

25Hz特徴レート
CNNエンコーダにストライド2の畳み込み層を追加し、最終的に25Hzの特徴を生成します。
多言語サポート
モデルのトレーニングには複数の多言語データセットの組み合わせが使用されました。
音声タグ付けツール
SpeechLMsのトレーニングにおいて重要な価値を示しています。

モデル能力

音声特徴抽出
音声言語モデリング
話し方変換

使用事例

音声処理
音声言語モデリング
音声言語モデルの構築に使用されます
話し方変換
話者のスタイル変換を実現するために使用されます
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase