# 低遅延音声処理

Ultravox V0 3
MIT
UltravoxはLlama3.1-8B-InstructとWhisper-smallをベースとしたマルチモーダル音声大規模言語モデルで、音声とテキスト入力を同時に処理できます。
音声生成テキスト Transformers 英語
U
FriendliAI
20
1
Ultravox V0 5 Llama 3 3 70b
MIT
UltravoxはLlama3.3-70BとWhisperを基に構築されたマルチモーダル音声大規模言語モデルで、音声とテキスト入力をサポートし、音声エージェントや翻訳などのシナリオに適しています。
音声生成テキスト Transformers 複数言語対応
U
fixie-ai
3,817
26
Ultravox V0 4 1 Llama 3 3 70b
MIT
UltravoxはLlama3.3-70B-Instructとwhisper-large-v3-turboを基に構築されたマルチモーダル音声大規模言語モデルで、音声とテキスト入力を同時に処理できます。
音声生成テキスト Transformers 複数言語対応
U
fixie-ai
26
10
Ultravox V0 4 1 Mistral Nemo
MIT
UltravoxはMistral-NemoとWhisperをベースにしたマルチモーダルモデルで、音声とテキスト入力を同時に処理でき、音声エージェントや音声翻訳などのタスクに適しています。
音声生成テキスト Transformers 複数言語対応
U
fixie-ai
1,285
25
Ultravox V0 4
MIT
UltravoxはLlama3.1-8B-InstructとWhisper-mediumを基にしたマルチモーダル音声大規模言語モデルで、音声とテキスト入力を同時に処理できます。
音声生成テキスト Transformers 複数言語対応
U
fixie-ai
1,851
48
Ultravox V0 3
MIT
UltravoxはLlama3.1-8B-InstructとWhisper-smallを基に構築されたマルチモーダル音声大規模言語モデルで、音声とテキスト入力を同時に処理できます。
テキスト生成オーディオ Transformers 英語
U
fixie-ai
48.30k
17
Postmalone
リアルタイム音声変換のためのモデルで、高品質な音声スタイル変換を実現
音声合成 Transformers
P
sail-rvc
1,679
1
Elonmuskv1
ElonMuskV1 はRVC (Retrieval-Based Voice Conversion) 技術に基づく音声変換モデルで、入力音声をイーロン・マスクのような声に変換できます。
音声合成 Transformers
E
sail-rvc
1,453
1
Arnoldschwarzenegger
これはRVC(Retrieval-based Voice Conversion)技術に基づく音声変換モデルで、入力音声をアーノルド・シュワルツェネッガーの声の特徴に変換できます。
音声合成 Transformers
A
sail-rvc
909
0
Ai Light Dance Stepmania Ft Wav2vec2 Large Xlsr 53 V1
Apache-2.0
このモデルは、wav2vec2-large-xlsr-53をGARY109/AI_LIGHT_DANCE - ONSET-STEPMANIA2データセットでファインチューニングした自動音声認識モデルです。
音声認識 Transformers
A
gary109
48
0
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase