Wav2vec2 Xls R 300m Adult Child Cls
facebook/wav2vec2-xls-r-300mをベースに微調整された成人と子供の音声分類モデルで、正解率は94.04%に達します。
ダウンロード数 48
リリース時間 : 3/2/2022
モデル概要
このモデルは成人と子供の音声を区別するために使用され、wav2vec2-xls-r-300mアーキテクチャをベースに微調整されており、音声分類タスクに適しています。
モデル特徴
高い正解率
評価セットで94.04%の正解率と94.40%のF1値を達成しました。
事前学習モデルをベースに微調整
facebook/wav2vec2-xls-r-300mの事前学習モデルをベースに微調整されており、優れた結果を得ています。
軽量
3億パラメータのモデル規模で、比較的軽量です。
モデル能力
音声分類
成人と子供の音声の区別
使用事例
音声分析
子供の音声認識システム
子供の音声を識別し、子供の音声認識システムを最適化するために使用されます。
94.04%の分類正解率
教育アプリケーション
教育アプリケーションで教師(成人)と学生(子供)の音声を区別します。
おすすめAIモデル
Llama 3 Typhoon V1.5x 8b Instruct
タイ語専用に設計された80億パラメータの命令モデルで、GPT-3.5-turboに匹敵する性能を持ち、アプリケーションシナリオ、検索拡張生成、制限付き生成、推論タスクを最適化
大規模言語モデル
Transformers 複数言語対応

L
scb10x
3,269
16
Cadet Tiny
Openrail
Cadet-TinyはSODAデータセットでトレーニングされた超小型対話モデルで、エッジデバイス推論向けに設計されており、体積はCosmo-3Bモデルの約2%です。
対話システム
Transformers 英語

C
ToddGoldfarb
2,691
6
Roberta Base Chinese Extractive Qa
RoBERTaアーキテクチャに基づく中国語抽出型QAモデルで、与えられたテキストから回答を抽出するタスクに適しています。
質問応答システム 中国語
R
uer
2,694
98