Donald Duck RVC V2 600 Epochs
これはRVC(Retrieval-based Voice Conversion)技術に基づく音声変換モデルで、入力音声をドナルドダックスタイルの声に変換できます。
ダウンロード数 2,675
リリース時間 : 7/14/2023
モデル概要
このモデルはRVC技術を使用して音声変換を行い、600エポックの訓練を経て、入力音声をドナルドダックのような独特な音色に変換できます。
モデル特徴
ドナルドダック音色変換
入力音声を特徴的なドナルドダックの声質に変換可能
600エポック訓練
600エポックの十分な訓練により、音色変換の品質を保証
RVC技術
検索ベースの音声変換技術により、高品質な音声スタイル変換を実現
モデル能力
音声音色変換
オーディオスタイル変換
使用事例
エンターテインメントアプリケーション
キャラクターボイスオーバー
動画やアニメにドナルドダックスタイルの吹き替えを追加
ドナルドダックの特徴的な音声効果を生成
面白ボイスチェンジ
通常の音声をドナルドダックスタイルに変換して娯楽目的で使用
ユーモラスで楽しい音声効果を創造
コンテンツクリエーション
特徴的なナレーション
動画コンテンツにユニークなドナルドダックスタイルのナレーションを追加
コンテンツの面白さと認知度を向上
おすすめAIモデル
Qwen2.5 VL 7B Abliterated Caption It I1 GGUF
Apache-2.0
Qwen2.5-VL-7B-Abliterated-Caption-itの量子化バージョンで、多言語画像記述タスクをサポートします。
画像生成テキスト
Transformers 複数言語対応

Q
mradermacher
167
1
Nunchaku Flux.1 Dev Colossus
その他
Colossus Project FluxのNunchaku量子化バージョンで、テキストプロンプトに基づいて高品質な画像を生成することを目的としています。このモデルは、推論効率を最適化しながら、性能損失を最小限に抑えます。
画像生成 英語
N
nunchaku-tech
235
3
Qwen2.5 VL 7B Abliterated Caption It GGUF
Apache-2.0
これはQwen2.5-VL-7Bモデルに基づく静的量子化バージョンで、画像記述生成タスクに特化し、複数の言語をサポートしています。
画像生成テキスト
Transformers 複数言語対応

Q
mradermacher
133
1
Olmocr 7B 0725 FP8
Apache-2.0
olmOCR-7B-0725-FP8は、Qwen2.5-VL-7B-Instructモデルをベースに、olmOCR-mix-0225データセットで微調整した後、FP8バージョンに量子化した文書OCRモデルです。
画像生成テキスト
Transformers 英語

O
allenai
881
3
Lucy 128k GGUF
Apache-2.0
Lucy-128kはQwen3 - 1.7Bをベースに開発された、プロキシ型ネットワーク検索と軽量ブラウジングに特化したモデルで、モバイルデバイスでも効率的に動作します。
大規模言語モデル
Transformers 英語

L
Mungert
263
2