orpheus-3b-0.1-ft-GGUFオープンソース音声モデル - 高品質で感情豊かな音声を無料で生成

ホーム

Orpheus 3b 0.1 Ft GGUF

unslothによって開発

Orpheus TTSは、Llamaをベースとした高度な音声大規模言語モデル（Speech - LLM）で、高品質で感情豊かな音声生成を目的として設計されています。

音声合成

Transformers

英語オープンソースライセンス:Apache-2.0 #ゼロショット音声クローニング #感情制御可能なTTS #低遅延ストリーミング伝送

ダウンロード数 779

リリース時間 : 7/9/2025

モデル概要

Orpheus TTSはファインチューニングされており、人間レベルに近い音声合成を実現し、優れた明瞭さ、表现力、リアルタイムストリーミング性能を備えています。

モデル特徴

人間に近い音声

自然な抑揚、感情、リズムで、現在の最先端の閉ソースモデルを上回っています。

ゼロショット音声クローニング

事前のファインチューニングなしで音声をクローニングできます。

誘導型の感情と抑揚

簡単なラベルを使用して音声と感情の特徴を制御できます。

低遅延

リアルタイムアプリケーションのストリーミング遅延は約200ミリ秒で、入力ストリーミングにより遅延を約100ミリ秒まで低減できます。

モデル能力

高品質音声合成

感情豊かな音声生成

リアルタイム音声ストリーミング

音声クローニング

使用事例

音声合成

バーチャルアシスタント

バーチャルアシスタントに自然で感情豊かな音声を生成します。

ユーザー体験を向上させ、音声対話をより自然にします。

オーディオブック

高品質のオーディオブックの音声を生成します。

人間の読み上げに近い音声効果を提供します。

リアルタイムアプリケーション

リアルタイム音声ストリーミング

低遅延音声合成が必要なリアルタイムアプリケーションに使用します。

遅延が100ミリ秒まで低減され、リアルタイム対話シーンに適しています。

🚀 オルフェウス 3B 0.1 ファインチューニング済み

オルフェウスTTSは、Llamaベースの最先端の音声合成モデルで、高品質で共感的なテキスト音声変換を実現します。このモデルは、人間レベルの音声合成を実現するためにファインチューニングされており、卓越した明瞭さ、表現力、リアルタイムストリーミング性能を達成しています。

🚀 クイックスタート

2025年3月18日 – 追加のファインチューニングを施した3BオルフェウスTTSモデルをリリースします。コードはGitHubで入手可能です：CanopyAI/Orpheus-TTS

✨ 主な機能

モデルの能力

人間に近い音声：自然な抑揚、感情、リズムを備え、最先端の閉ソースモデルを上回る品質
ゼロショットボイスクローニング：事前のファインチューニングなしで声をクローン
感情と抑揚の制御：簡単なタグで音声と感情の特性を制御
低レイテンシ：リアルタイムアプリケーション向けに約200msのストリーミングレイテンシ、入力ストリーミングで約100msまで削減可能

モデルのソース

GitHubリポジトリ：https://github.com/canopyai/Orpheus-TTS
ブログ記事：https://canopylabs.ai/model-releases
Colab推論ノートブック：ノートブックリンク

💻 使用例

基本的な使用法

ファインチューニング済みモデルで簡単に推論を実行する方法については、Colab（Colabのリンク）またはGitHub（GitHubのリンク）をご確認ください。

📚 ドキュメント

モデルの誤用について

同意を得ずに偽装する目的、誤情報や欺瞞行為（偽ニュースや詐欺電話を含む）、または違法もしくは有害な活動にこのモデルを使用しないでください。このモデルを使用することで、すべての適用される法律および倫理ガイドラインに従うことに同意するものとします。当社は、いかなる使用に対しても責任を負いません。

📄 ライセンス

このモデルは、Apache 2.0ライセンスの下で提供されています。

おすすめAIモデル

Llama 3 Typhoon V1.5x 8b Instruct

タイ語専用に設計された80億パラメータの命令モデルで、GPT-3.5-turboに匹敵する性能を持ち、アプリケーションシナリオ、検索拡張生成、制限付き生成、推論タスクを最適化

Cadet-TinyはSODAデータセットでトレーニングされた超小型対話モデルで、エッジデバイス推論向けに設計されており、体積はCosmo-3Bモデルの約2％です。

Roberta Base Chinese Extractive Qa

RoBERTaアーキテクチャに基づく中国語抽出型QAモデルで、与えられたテキストから回答を抽出するタスクに適しています。

質問応答システム中国語

uer

2,694

未来を切り開く、あなたのAIソリューション知識ベース

English 简体中文繁體中文にほんご