A

Anime Whisper

litaginによって開発
日本のアニメスタイルの演技台詞分野に特化した日本語音声認識モデル
ダウンロード数 4,873
リリース時間 : 11/10/2024

モデル概要

kotoba-whisper-v2.0をファインチューニングし、アニメスタイル音声に最適化した日本語ASRモデル。非言語発声や感情表現の処理に特に優れる

モデル特徴

幻覚現象低減
同類モデルに比べ誤生成内容を大幅に削減
非言語発声認識
間、笑い声、叫び、息遣いなどの非言語発声を正確に捕捉
感情的な句読点生成
音声のリズムと感情に合わせ自然に句読点を生成し、台本レベルのテキスト流暢性を実現
アニメ音声最適化
アニメスタイルの演技台詞認識精度が特に優れている
NSFWコンテンツ処理
他のモデルが苦手とする成人向け音声の転写を専門的に処理可能

モデル能力

日本語音声認識
アニメスタイル音声転写
非言語発声認識
感情的なテキスト生成

使用事例

アニメ制作
アニメ声優台詞転写
アニメの声優台詞を台本形式テキストに変換
汎用モデル比で約20%精度向上
ゲーム開発
ビジュアルノベル台詞転写
Galgameゲーム内の会話内容を自動転写
CER(文字誤り率)平均13.0%
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase