P

Personal Speech To Text Model

fractalegoによって開発
facebook/wav2vec2-large-robust-ft-swbd-300hモデルをベースに微調整した個人向け音声テキスト変換モデルで、特定のアクセントに最適化されています。
ダウンロード数 75
リリース時間 : 3/2/2022

モデル概要

このモデルは個人のアクセントに最適化された音声認識モデルで、約1000件の個人音声録音で微調整されており、特定のアクセントをより正確に認識できます。

モデル特徴

アクセント最適化
特定のアクセントに最適化され、認識精度を向上させます。
軽量微調整
約1000件の個人音声録音のみで微調整され、モデルの効率性を維持します。
強力なベースモデル
Facebookのwav2vec2-large-robust-ft-swbd-300hモデルをベースにしており、強力な音声認識能力を備えています。

モデル能力

音声テキスト変換
特定アクセント認識

使用事例

個人利用
個人音声メモ変換
個人の音声メモを正確にテキストに変換
特定アクセントユーザーの音声認識精度向上
音声コマンド認識
特定アクセントの音声コマンドを認識
スマートホーム等の音声制御体験改善
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase