JoyHallo-v1オープンソースモデル - 中国語の音声から無料でリアルな顔のアニメーションを生成

ホーム

Joyhallo V1

jdh-algoによって開発

JoyHalloは標準中国語に特化した音声駆動の顔面アニメーション生成モデルで、標準中国語の音声からリアルな顔面アニメーションを生成できます。

テキスト生成ビデオオープンソースライセンス:MIT #標準中国語デジタルヒューマン #音声駆動アニメーション #クロスランゲージ生成

ダウンロード数 26

リリース時間 : 9/18/2024

モデル概要

このモデルは標準中国語の音声特性に最適化され、唇、表情、姿勢の特徴を処理する半分離構造を採用し、中国語動画生成の品質を大幅に向上させると同時に、英語生成能力も保持しています。

モデル特徴

標準中国語最適化

標準中国語の複雑な唇の動きに特化して最適化され、中国語音声駆動アニメーションの技術的課題を解決

半分離構造

唇、表情、姿勢特徴間の関連関係を処理する革新的な半分離構造を採用し、情報利用効率を向上

クロスランゲージ能力

標準中国語生成を最適化しながら、優れた英語動画生成能力を保持

効率的な推論

従来構造と比較し、推論速度が14.3%向上

モデル能力

標準中国語音声駆動顔面アニメーション生成

英語音声駆動顔面アニメーション生成

唇の動き同期

顔面表情生成

頭部姿勢シミュレーション

使用事例

デジタルヒューマンアプリケーション

バーチャルアナウンサー

標準中国語のニュース放送や番組司会のためのリアルなデジタルヒューマン動画を生成

自然で滑らかな唇の同期と表情変化を実現

医療相談

専門的な医療コンテンツの解説動画を生成

専門用語の発音口形を正確に伝達

教育分野

言語教育

標準的な標準中国語発音のデモンストレーション動画を生成

発音時の唇の動きを明確に表示

おすすめAIモデル

Llama 3 Typhoon V1.5x 8b Instruct

タイ語専用に設計された80億パラメータの命令モデルで、GPT-3.5-turboに匹敵する性能を持ち、アプリケーションシナリオ、検索拡張生成、制限付き生成、推論タスクを最適化

Cadet-TinyはSODAデータセットでトレーニングされた超小型対話モデルで、エッジデバイス推論向けに設計されており、体積はCosmo-3Bモデルの約2％です。

Roberta Base Chinese Extractive Qa

RoBERTaアーキテクチャに基づく中国語抽出型QAモデルで、与えられたテキストから回答を抽出するタスクに適しています。

質問応答システム中国語

uer

2,694

未来を切り開く、あなたのAIソリューション知識ベース

English 简体中文繁體中文にほんご

Joyhallo V1

モデル概要

モデル特徴

モデル能力

使用事例

🚀 JoyHallo: 中国語用デジタルヒューマンモデル

📚 ドキュメント

📄 ライセンス