Whisper Large V3 Turbo
OpenAI Whisper Large v3 Turboモデルを基にヘブライ語向けに微調整した自動音声認識モデル
ダウンロード数 988
リリース時間 : 2/9/2025
モデル概要
本モデルはヘブライ語に最適化された自動音声認識(ASR)モデルで、ヘブライ語の音声転写シーンに適しています。
モデル特徴
ヘブライ語最適化
ヘブライ語に特化して微調整され、ヘブライ語の音声転写精度を向上
複数データセット学習
3つの異なるソースのヘブライ語データセットを使用して学習し、多様な音声シーンをカバー
効率的な学習
混合精度学習と最適化されたハイパーパラメータを採用し、8枚のA40 GPUでわずか9時間で学習完了
モデル能力
ヘブライ語音声転写
音声認識
使用事例
政府議事録
イスラエル議会議事録転写
イスラエル議会本会議のヘブライ語内容を転写するために使用
学習データには約325時間の議会議事録が含まれる
クラウドソーシング転写
公開音声ソース転写
様々な公開ソースのヘブライ語音声を転写するために使用
学習データには約300時間のクラウドソーシング転写データが含まれる
教育応用
ウィキペディアコンテンツ朗読転写
ヘブライ語ウィキペディアコンテンツの朗読音声を転写するために使用
学習データには約50時間のクラウドソーシング録音データが含まれる
おすすめAIモデル
Llama 3 Typhoon V1.5x 8b Instruct
タイ語専用に設計された80億パラメータの命令モデルで、GPT-3.5-turboに匹敵する性能を持ち、アプリケーションシナリオ、検索拡張生成、制限付き生成、推論タスクを最適化
大規模言語モデル
Transformers 複数言語対応

L
scb10x
3,269
16
Cadet Tiny
Openrail
Cadet-TinyはSODAデータセットでトレーニングされた超小型対話モデルで、エッジデバイス推論向けに設計されており、体積はCosmo-3Bモデルの約2%です。
対話システム
Transformers 英語

C
ToddGoldfarb
2,691
6
Roberta Base Chinese Extractive Qa
RoBERTaアーキテクチャに基づく中国語抽出型QAモデルで、与えられたテキストから回答を抽出するタスクに適しています。
質問応答システム 中国語
R
uer
2,694
98