Wav2vec2 Bjorn
wav2vec 2.0は自己教師あり学習の音声認識モデルで、大量の未ラベル音声データで事前学習され、効率的に音声をテキストに変換できます。
ダウンロード数 40
リリース時間 : 6/23/2022
モデル概要
wav2vec 2.0はTransformerアーキテクチャに基づく音声認識モデルで、生の音声データから特徴を抽出する自己教師あり学習を行い、様々な音声テキスト変換シナリオに適用可能です。
モデル特徴
自己教師あり学習
大量の未ラベル音声データで事前学習され、ラベルデータへの依存を軽減します。
効率的な微調整
少量のラベルデータで微調整可能で、特定の音声認識ニーズに対応できます。
多言語対応
微調整データに依存して、複数言語の音声認識をサポートします。
モデル能力
音声からテキストへ
音声特徴抽出
多言語音声認識
使用事例
個人アシスタント
個人音声メモ
個人の音声記録をテキストに変換し、整理や検索を容易にします。
高い精度の音声テキスト変換で、個人使用シーンに適しています。
音声書き起こし
会議議事録
会議録音をテキスト記録に変換し、後続の整理や共有を容易にします。
長時間の音声書き起こしに対応し、会議シーンに適しています。
おすすめAIモデル
Llama 3 Typhoon V1.5x 8b Instruct
タイ語専用に設計された80億パラメータの命令モデルで、GPT-3.5-turboに匹敵する性能を持ち、アプリケーションシナリオ、検索拡張生成、制限付き生成、推論タスクを最適化
大規模言語モデル
Transformers 複数言語対応

L
scb10x
3,269
16
Cadet Tiny
Openrail
Cadet-TinyはSODAデータセットでトレーニングされた超小型対話モデルで、エッジデバイス推論向けに設計されており、体積はCosmo-3Bモデルの約2%です。
対話システム
Transformers 英語

C
ToddGoldfarb
2,691
6
Roberta Base Chinese Extractive Qa
RoBERTaアーキテクチャに基づく中国語抽出型QAモデルで、与えられたテキストから回答を抽出するタスクに適しています。
質問応答システム 中国語
R
uer
2,694
98