K

Kushinada Hubert Base

imprtによって開発
62,215時間の日本のテレビ放送音声データに基づいて事前学習された日本語音声特徴抽出モデル
ダウンロード数 1,922
リリース時間 : 3/7/2025

モデル概要

これは日本語音声に特化して設計されたHuBERT基本モデルで、大規模な日本のテレビ放送音声データを用いて事前学習されており、音声特徴抽出タスクに適しています。

モデル特徴

大規模事前学習データ
62,215時間の日本のテレビ放送音声データを使用して事前学習されており、モデルが日本語音声を深く理解できるようになっています
専門的な音声特徴抽出
HuBERTアーキテクチャに基づいて最適化されており、日本語音声の高度な特徴表現を抽出するために特別に設計されています
テレビ放送分野への適応
訓練データはテレビ放送から取得されており、正式な話し言葉や放送音声に適応性があります

モデル能力

日本語音声特徴抽出
音声活動検出
音声表現学習

使用事例

音声処理
音声認識前処理
日本語音声認識システムのフロントエンド特徴抽出モジュールとして使用
音声内容分析
テレビ放送内容の音声特徴を分析するために使用
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase