I

Ipa Whisper Base

neurlangによって開発
Whisper-baseをファインチューニングした多言語音声認識モデルで、国際音声記号(IPA)出力をサポート
ダウンロード数 599
リリース時間 : 4/11/2025

モデル概要

このモデルはOpenAI Whisper-baseアーキテクチャをファインチューニングした自動音声認識(ASR)モデルで、国際音声記号(IPA)転写タスクに最適化されており、複数言語の音声からIPA記号への変換をサポート

モデル特徴

多言語IPA転写
複数言語の音声を直接国際音声記号に変換可能
Whisperアーキテクチャベース
Whisperの強力な事前学習基盤を活用し、優れた汎化性能を有する
長時間音声処理
チャンク分割アルゴリズムにより任意の長さの音声入力を処理可能

モデル能力

音声から国際音声記号へ
多言語音声認識
長時間音声転写
タイムスタンプ予測

使用事例

言語学分析
音声学研究
音声サンプルを標準音声記号に変換する音声学研究に使用
正確な音声記号転写結果を提供
言語教育
発音教育補助
言語学習者の発音分析と標準音声記号との比較を支援
発音の差異を可視化
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase