W

Wav2vec En Finetuned On Cryptocurrency

distractedm1ndによって開発
このモデルはfacebook/wav2vec2-large-960hをベースに微調整された音声認識モデルで、暗号通貨分野のポッドキャストコンテンツに特化して最適化されています。
ダウンロード数 22
リリース時間 : 3/2/2022

モデル概要

これは暗号通貨分野のオーディオコンテンツ向けに最適化された自動音声認識(ASR)モデルで、暗号通貨関連ポッドキャストにおいてベースモデルよりも優れた性能を発揮します。

モデル特徴

暗号通貨分野最適化
暗号通貨関連の専門用語や表現に特化して微調整されています
性能向上が顕著
暗号通貨データセットでWERが27%から13.1%に改善、約50%の向上
高品質なトレーニングデータ
約1400件の手作業で校正された暗号通貨ポッドキャストクリップを使用してトレーニング

モデル能力

英語音声認識
暗号通貨分野専門用語認識
短いオーディオクリップ(10-15秒)処理

使用事例

フィンテック
暗号通貨ポッドキャスト文字起こし
暗号通貨関連のポッドキャストコンテンツを自動的にテキストに変換
汎用モデルと比べて認識精度が大幅に向上
金融オーディオコンテンツ分析
暗号通貨市場の音声コメントや議論の分析に使用
専門用語や業界特有の表現を正確に認識可能
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase