O

Orpheus 3b Chinese FT Q8 0.gguf

lex-auによって開発
Orpheusは高性能なテキスト音声変換モデルで、自然な感情表現を伴う音声合成に特化してファインチューニングされています。このリポジトリでは30億パラメータモデルの8ビット量子化バージョンをホストしており、高品質な出力を維持しながら効率を最適化しています。
ダウンロード数 58
リリース時間 : 4/18/2025

モデル概要

Orpheus-3b-FT-Q8_0は30億パラメータのテキスト音声変換モデルで、テキスト入力を自然な音声に変換し、複数の音色と感情表現をサポートします。このモデルは効率的な推論を実現するため8ビット(Q8_0)形式に量子化されており、コンシューマーグレードのハードウェアで動作可能です。

モデル特徴

多彩な音色サポート
2種類の特徴的な音色を選択可能:'長楽'(優しいスタイルの女性声)と'白芷'(澄んだスタイルの女性声)
感情表現
笑い声、ため息などの感情タグを挿入することで表現力を強化
効率的な推論
8ビット量子化(Q8_0)形式により推論効率を最適化し、コンシューマーグレードのハードウェアで動作可能
高品質な音声出力
24kHzモノラルの高品質音声を生成し、会話の自然さに重点を置いてファインチューニング

モデル能力

テキスト音声変換
感情音声合成
多彩な音色音声生成

使用事例

音声インタラクションアプリケーション
インテリジェントカスタマーサービス音声
インテリジェントカスタマーサービスシステム向けに自然で感情豊かな音声応答を生成
ユーザー体験を向上させ、インタラクションをより自然にする
音声コンテンツ制作
オーディオブックやポッドキャストコンテンツを自動生成
高品質な音声コンテンツを効率的に生成
支援技術
音声支援ツール
視覚障害ユーザー向けにテキスト音声変換機能を提供
自然で滑らかな音声出力を提供
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase