K

Kotoba Whisper Bilingual V1.0

kotoba-techによって開発
Kotoba-Whisper-BilingualはWhisperモデルを蒸留して訓練されたモデルで、日本語と英語の音声認識および音声からテキストへの翻訳タスクのために設計されています。
ダウンロード数 782
リリース時間 : 9/27/2024

モデル概要

このモデルは日本語と英語の自動音声認識(ASR)および日本語と英語間の音声からテキストへの翻訳タスクをサポートします。

モデル特徴

バイリンガルサポート
日本語と英語の音声認識および相互翻訳を同時にサポート
効率的な推論
オリジナルのWhisper large-v3モデルよりも6.3倍高速
マルチタスク能力
音声認識と音声からテキストへの翻訳タスクを同時に実行可能

モデル能力

日本語音声認識
英語音声認識
日本語から英語への音声翻訳
英語から日本語への音声翻訳

使用事例

音声認識
日本語音声書き起こし
日本語音声をテキストに変換
CommonVoice 8日本語テストセットでCERが9.8
英語音声書き起こし
英語音声をテキストに変換
ESBデータセットで良好な性能
音声翻訳
日本語から英語への翻訳
日本語音声をリアルタイムで英語テキストに翻訳
CoVoST2(Ja->En)でWERが73.9
英語から日本語への翻訳
英語音声をリアルタイムで日本語テキストに翻訳
CoVoST2(En->Ja)でCERが69.1
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase