Joyhallo V1
JoyHalloは標準中国語に特化した音声駆動の顔面アニメーション生成モデルで、標準中国語の音声からリアルな顔面アニメーションを生成できます。
ダウンロード数 26
リリース時間 : 9/18/2024
モデル概要
このモデルは標準中国語の音声特性に最適化され、唇、表情、姿勢の特徴を処理する半分離構造を採用し、中国語動画生成の品質を大幅に向上させると同時に、英語生成能力も保持しています。
モデル特徴
標準中国語最適化
標準中国語の複雑な唇の動きに特化して最適化され、中国語音声駆動アニメーションの技術的課題を解決
半分離構造
唇、表情、姿勢特徴間の関連関係を処理する革新的な半分離構造を採用し、情報利用効率を向上
クロスランゲージ能力
標準中国語生成を最適化しながら、優れた英語動画生成能力を保持
効率的な推論
従来構造と比較し、推論速度が14.3%向上
モデル能力
標準中国語音声駆動顔面アニメーション生成
英語音声駆動顔面アニメーション生成
唇の動き同期
顔面表情生成
頭部姿勢シミュレーション
使用事例
デジタルヒューマンアプリケーション
バーチャルアナウンサー
標準中国語のニュース放送や番組司会のためのリアルなデジタルヒューマン動画を生成
自然で滑らかな唇の同期と表情変化を実現
医療相談
専門的な医療コンテンツの解説動画を生成
専門用語の発音口形を正確に伝達
教育分野
言語教育
標準的な標準中国語発音のデモンストレーション動画を生成
発音時の唇の動きを明確に表示
おすすめAIモデル
Llama 3 Typhoon V1.5x 8b Instruct
タイ語専用に設計された80億パラメータの命令モデルで、GPT-3.5-turboに匹敵する性能を持ち、アプリケーションシナリオ、検索拡張生成、制限付き生成、推論タスクを最適化
大規模言語モデル
Transformers 複数言語対応

L
scb10x
3,269
16
Cadet Tiny
Openrail
Cadet-TinyはSODAデータセットでトレーニングされた超小型対話モデルで、エッジデバイス推論向けに設計されており、体積はCosmo-3Bモデルの約2%です。
対話システム
Transformers 英語

C
ToddGoldfarb
2,691
6
Roberta Base Chinese Extractive Qa
RoBERTaアーキテクチャに基づく中国語抽出型QAモデルで、与えられたテキストから回答を抽出するタスクに適しています。
質問応答システム 中国語
R
uer
2,694
98