M

Mhubert Base 25hz

Developed by slprl
Meta社のHubertモデルのバージョンで、TWIST論文で提案され、SpeechLMsを訓練するための音声タグ付けツールとして重要な価値を示しています。
Downloads 10.63k
Release Time : 10/24/2024

Model Overview

このHubertモデルは音声特徴抽出に使用され、音声言語モデリングや話し方変換などのシナリオに適しています。

Model Features

25Hz特徴レート
CNNエンコーダにストライド2の畳み込み層を追加し、最終的に25Hzの特徴を生成します。
多言語サポート
モデルのトレーニングには複数の多言語データセットの組み合わせが使用されました。
音声タグ付けツール
SpeechLMsのトレーニングにおいて重要な価値を示しています。

Model Capabilities

音声特徴抽出
音声言語モデリング
話し方変換

Use Cases

音声処理
音声言語モデリング
音声言語モデルの構築に使用されます
話し方変換
話者のスタイル変換を実現するために使用されます
AIbase
Empowering the Future, Your AI Solution Knowledge Base
© 2025AIbase