C

Crisperwhisper

nyrahealthによって開発
CrisperWhisperはOpenAI Whisperの高度なバリアントで、迅速かつ正確な逐語的な音声認識のために設計されており、正確(明確)な単語レベルのタイムスタンプを提供します。
ダウンロード数 10.23k
リリース時間 : 8/29/2024

モデル概要

CrisperWhisperはOpenAI Whisperの高度なバリアントで、迅速かつ正確な逐語的な音声認識のために設計されており、正確(明確)な単語レベルのタイムスタンプを提供します。元のWhisperが不流暢な部分を省略し、より意訳的な転写スタイルを採用する傾向があるのに対し、CrisperWhisperはフィラー、ポーズ、吃音、誤った開始を含むすべての話し言葉を正確に転写することを目的としています。

モデル特徴

正確な単語レベルタイムスタンプ
トークナイザーの調整とトレーニングでのカスタムアテンション損失を使用することで、不流暢やポーズを処理する際にも正確なタイムスタンプを提供します。
逐語転写
「um」や「uh」などのフィラーを含むすべての話し言葉を正確に転写し、区別します。
フィラー検出
フィラーを検出し、正確に転写します。
幻覚の削減
転写における幻覚を最小限に抑え、正確性を向上させます。

モデル能力

音声認識
単語レベルタイムスタンプ生成
フィラー検出
多言語サポート

使用事例

音声転写
会議議事録
不流暢な部分やフィラーを含む会議内容を正確に記録するために使用します。
逐語転写と正確なタイムスタンプを提供します。
学術研究
インタビューや研究データを転写し、すべての話し言葉の詳細が正確に記録されるようにします。
高精度の逐語転写。
音声分析
音声行動分析
話者の不流暢なパターンやフィラーの使用状況を分析します。
詳細な音声行動データを提供します。
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase