chinese - hubert - baseオープンソース中国語音声モデル - 無料でデプロイし、さまざまな音声関連タスクを支援

ホーム

Chinese Hubert Base

TencentGameMateによって開発

1万時間のWenetSpeech Lサブセットで事前学習された中国語音声モデル、音声関連タスクに適応

音声認識

Transformers

オープンソースライセンス:MIT #中国語音声事前学習 #教師なし特徴抽出 #Wav2Vec2アーキテクチャ

ダウンロード数 1,312

リリース時間 : 6/2/2022

モデル概要

このモデルは中国語音声データ向けの事前学習モデルで、Wav2Vec2/HuBERTアーキテクチャを採用し、音声特徴抽出などのタスクに使用可能。音声認識に使用するには、トークナイザーとアノテーションデータによるファインチューニングが必要です。

モデル特徴

大規模中国語事前学習

1万時間の中国語音声データ(WenetSpeech Lサブセット)で事前学習

軽量デプロイ

半精度推論(half precision)をサポートし、計算リソース要件を低減

柔軟な適応

基盤モデルとして様々な下流音声タスクに適応可能

モデル能力

音声特徴抽出

音声表現学習

使用事例

音声処理

音声認識基盤モデル

ファインチューニングにより中国語音声認識システム構築に使用可能

トークナイザーとアノテーションデータによるファインチューニングが必要

音声特徴抽出

音声の高レベル特徴表現を抽出

後続の音声分析タスクに使用可能

おすすめAIモデル

Llama 3 Typhoon V1.5x 8b Instruct

タイ語専用に設計された80億パラメータの命令モデルで、GPT-3.5-turboに匹敵する性能を持ち、アプリケーションシナリオ、検索拡張生成、制限付き生成、推論タスクを最適化

Cadet-TinyはSODAデータセットでトレーニングされた超小型対話モデルで、エッジデバイス推論向けに設計されており、体積はCosmo-3Bモデルの約2％です。

Roberta Base Chinese Extractive Qa

RoBERTaアーキテクチャに基づく中国語抽出型QAモデルで、与えられたテキストから回答を抽出するタスクに適しています。

質問応答システム中国語

uer

2,694

未来を切り開く、あなたのAIソリューション知識ベース

English 简体中文繁體中文にほんご

Chinese Hubert Base

モデル概要

モデル特徴

モデル能力

使用事例

🚀 中国語音声事前学習モデル

🚀 クイックスタート

必要なPythonパッケージ

💻 使用例

基本的な使用法

📄 ライセンス