W

Wav2vec2 Xls R 300m Adult Child Cls

anantojによって開発
facebook/wav2vec2-xls-r-300mをベースに微調整された成人と子供の音声分類モデルで、正解率は94.04%に達します。
ダウンロード数 48
リリース時間 : 3/2/2022

モデル概要

このモデルは成人と子供の音声を区別するために使用され、wav2vec2-xls-r-300mアーキテクチャをベースに微調整されており、音声分類タスクに適しています。

モデル特徴

高い正解率
評価セットで94.04%の正解率と94.40%のF1値を達成しました。
事前学習モデルをベースに微調整
facebook/wav2vec2-xls-r-300mの事前学習モデルをベースに微調整されており、優れた結果を得ています。
軽量
3億パラメータのモデル規模で、比較的軽量です。

モデル能力

音声分類
成人と子供の音声の区別

使用事例

音声分析
子供の音声認識システム
子供の音声を識別し、子供の音声認識システムを最適化するために使用されます。
94.04%の分類正解率
教育アプリケーション
教育アプリケーションで教師(成人)と学生(子供)の音声を区別します。
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase