Orpheus 3b 0.1 Ft GGUF
Orpheus TTSは、Llamaをベースとした高度な音声大規模言語モデル(Speech - LLM)で、高品質で感情豊かな音声生成を目的として設計されています。
ダウンロード数 779
リリース時間 : 7/9/2025
モデル概要
Orpheus TTSはファインチューニングされており、人間レベルに近い音声合成を実現し、優れた明瞭さ、表现力、リアルタイムストリーミング性能を備えています。
モデル特徴
人間に近い音声
自然な抑揚、感情、リズムで、現在の最先端の閉ソースモデルを上回っています。
ゼロショット音声クローニング
事前のファインチューニングなしで音声をクローニングできます。
誘導型の感情と抑揚
簡単なラベルを使用して音声と感情の特徴を制御できます。
低遅延
リアルタイムアプリケーションのストリーミング遅延は約200ミリ秒で、入力ストリーミングにより遅延を約100ミリ秒まで低減できます。
モデル能力
高品質音声合成
感情豊かな音声生成
リアルタイム音声ストリーミング
音声クローニング
使用事例
音声合成
バーチャルアシスタント
バーチャルアシスタントに自然で感情豊かな音声を生成します。
ユーザー体験を向上させ、音声対話をより自然にします。
オーディオブック
高品質のオーディオブックの音声を生成します。
人間の読み上げに近い音声効果を提供します。
リアルタイムアプリケーション
リアルタイム音声ストリーミング
低遅延音声合成が必要なリアルタイムアプリケーションに使用します。
遅延が100ミリ秒まで低減され、リアルタイム対話シーンに適しています。
おすすめAIモデル
Llama 3 Typhoon V1.5x 8b Instruct
タイ語専用に設計された80億パラメータの命令モデルで、GPT-3.5-turboに匹敵する性能を持ち、アプリケーションシナリオ、検索拡張生成、制限付き生成、推論タスクを最適化
大規模言語モデル
Transformers 複数言語対応

L
scb10x
3,269
16
Cadet Tiny
Openrail
Cadet-TinyはSODAデータセットでトレーニングされた超小型対話モデルで、エッジデバイス推論向けに設計されており、体積はCosmo-3Bモデルの約2%です。
対話システム
Transformers 英語

C
ToddGoldfarb
2,691
6
Roberta Base Chinese Extractive Qa
RoBERTaアーキテクチャに基づく中国語抽出型QAモデルで、与えられたテキストから回答を抽出するタスクに適しています。
質問応答システム 中国語
R
uer
2,694
98