# 多言語音声書き起こし

Granite Speech 3.3 8b
Apache-2.0
自動音声認識(ASR)と自動音声翻訳(AST)向けに設計されたコンパクトで効率的な音声言語モデル。オーディオとテキストを二段階で処理する設計
テキスト生成オーディオ Transformers 英語
G
ibm-granite
5,532
35
Whisper Fleurs Small Te In
Apache-2.0
このモデルはOpenAIのWhisper SmallをFLEURSデータセットでファインチューニングしたバージョンで、音声認識タスクに特化しており、テルグ語(te)をサポートしています。
音声認識 Transformers その他
W
jonahdvt
14
1
Lite Whisper Large V3 Acc
Apache-2.0
Lite-Whisper は OpenAI Whisper の圧縮バージョンで、LiteASR 技術を採用し、高い精度を維持しながらモデルサイズを削減しています。
音声認識 Transformers
L
efficient-speech
57
3
Whisper Base Pl
Apache-2.0
OpenAI Whisper-baseモデルをポーランド語Common Voice 17.0データセットでファインチューニングした音声認識モデル
音声認識 Transformers その他
W
marcsixtysix
27
1
Whisper Large V3 Telugu Romanized
Apache-2.0
openai/whisper-large-v3をファインチューニングしたローマ字化テルグ語音声認識モデル
音声認識 Transformers その他
W
jayasuryajsk
18
1
English Filipino Wav2vec2 L Xls R Test 08
Apache-2.0
これはwav2vec2-large-xlsr-53-englishモデルをフィリピン語音声データセットでファインチューニングした音声認識モデルです
音声認識 Transformers
E
Khalsuu
25
0
English Filipino Wav2vec2 L Xls R Test 05
Apache-2.0
これはwav2vec2-large-xlsr-53-englishモデルをフィリピン語音声データセットでファインチューニングした音声認識モデルで、英語とフィリピン語の音声からテキストへの変換タスクをサポートします。
音声認識 Transformers
E
Khalsuu
67
1
English Filipino Wav2vec2 L Xls R Test 02
Apache-2.0
これはwav2vec2-large-xlsr-53-englishモデルをフィリピン語音声データセットでファインチューニングした音声認識モデルで、英語とフィリピン語の音声からテキストへの変換タスクをサポートします。
音声認識 Transformers
E
Khalsuu
21
0
Pyctcdecode Asr
pyctcdecodeライブラリとHugging Faceモデルを組み合わせた自動音声認識(ASR)ソリューションで、効率的なデコード能力を提供
音声認識
P
osanseviero
16
1
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase