C

Crisperwhisper

unslothによって開発
CrisperWhisperはOpenAI Whisperの進化版で、迅速かつ正確な逐語記録のための音声認識に特化し、正確(クリア)な単語レベルのタイムスタンプを提供します。
ダウンロード数 50
リリース時間 : 5/14/2025

モデル概要

CrisperWhisperはWhisperの改良版で、フィラー言葉、間、吃音、誤った開始を含むすべての話し言葉を正確に文字起こしし、より正確な単語レベルのタイムスタンプを提供します。

モデル特徴

正確な単語レベルタイムスタンプ
トークナイザーの調整とトレーニング中のカスタムアテンション損失により、不自然な間やポーズでも正確にマークできる正確なタイムスタンプを提供します。
逐語文字起こし
'um'や'uh'などのフィラー言葉を区別して記録し、すべての話し言葉を忠実に文字起こしします。
フィラー検出
フィラー言葉を正確に検出し文字起こしします。
幻覚削減
文字起こしの幻覚を最小限に抑え、正確性を向上させます。

モデル能力

音声認識
単語レベルタイムスタンプ生成
フィラー検出
多言語対応

使用事例

音声文字起こし
会議議事録
会議中のすべての言葉、間やフィラー言葉を含めて正確に記録します。
より完全な会議記録を提供し、後日の分析を容易にします。
インタビュー文字起こし
インタビュー内容を文字起こしし、すべての話し言葉の特徴を保持します。
より真実に迫ったインタビュー記録で、話し言葉の表現研究に役立ちます。
音声分析
話し言葉分析
話し言葉中のフィラー言葉や間のパターンを分析します。
言語学者が話し言葉の特徴を研究するのに役立ちます。
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase