W

Wav2vec2 Large 960h Lv60 Self MIDIARIES 72H FT

caurdyによって開発
Facebookが事前学習したwav2vec2 large 960H lv60自己教師ありモデルを基に、72時間のMI日記データで微調整した音声認識モデル
ダウンロード数 20
リリース時間 : 4/21/2022

モデル概要

このモデルは医療面接シーンに特化して最適化された音声認識モデルで、微調整により医療対話シーンでの認識精度が大幅に向上しました

モデル特徴

医療シーン最適化
72時間の医療面接データで微調整されており、医療対話シーンに特に適しています
性能向上
20分間のMI日記テストセットで、単語誤り率が13%から9.7%に低下
成熟したアーキテクチャ採用
Facebookが事前学習したwav2vec2 large 960H lv60自己教師ありモデルを基にしています

モデル能力

英語音声認識
医療対話転写
自動音声テキスト変換

使用事例

医療健康
医療面接記録
医師と患者間の対話を自動転写
単語誤り率が9.7%に低下
医療文書生成
医療面接録音を自動的に構造化文書に変換
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase