Mandarinオープンソースの中国語（普通話）音声認識モデル - 無料でデプロイし、高精度に中国語（普通話）の音声を認識する

ホーム

Mandarin

GleamEyeBeastによって開発

これはwav2vec2-large-xlsr-53モデルをcommon_voiceデータセットで微調整した中国語（普通話）の音声認識モデルです。

音声認識

Transformers

オープンソースライセンス:Apache-2.0 #音声認識 #中国語（普通話）最適化 #wav2vec2の微調整

ダウンロード数 25

リリース時間 : 3/2/2022

モデル概要

このモデルは主に中国語（普通話）の音声認識タスクに使用され、Facebookのwav2vec2アーキテクチャをベースに微調整されています。

モデル特徴

wav2vec2アーキテクチャをベースに

Facebookのwav2vec2-large-xlsr-53アーキテクチャを採用し、良好な音声認識の基礎を持っています。

中国語（普通話）最適化

中国語（普通話）の音声特性に合わせて特別に微調整されています。

オープンソースライセンス

Apache 2.0ライセンスを使用しており、商用および研究用途が許可されています。

モデル能力

中国語（普通話）音声認識

音声からテキストへの変換

使用事例

音声書き起こし

中国語（普通話）音声をテキストに変換

中国語（普通話）の音声内容をテキストに変換します。

音声アシスタント

中国語（普通話）音声インタラクション

中国語（普通話）の音声アシスタントの構築に使用できます。

Property	Details
Model Type	中国語（北京語）音声処理モデル
Training Data	common_voice

おすすめAIモデル

Llama 3 Typhoon V1.5x 8b Instruct

タイ語専用に設計された80億パラメータの命令モデルで、GPT-3.5-turboに匹敵する性能を持ち、アプリケーションシナリオ、検索拡張生成、制限付き生成、推論タスクを最適化

Cadet-TinyはSODAデータセットでトレーニングされた超小型対話モデルで、エッジデバイス推論向けに設計されており、体積はCosmo-3Bモデルの約2％です。

Roberta Base Chinese Extractive Qa

RoBERTaアーキテクチャに基づく中国語抽出型QAモデルで、与えられたテキストから回答を抽出するタスクに適しています。

質問応答システム中国語

uer

2,694

未来を切り開く、あなたのAIソリューション知識ベース

English 简体中文繁體中文にほんご

Mandarin

モデル概要

モデル特徴

モデル能力

使用事例

🚀 中国語（北京語）モデル

🚀 クイックスタート

🔧 技術詳細

トレーニングハイパーパラメータ

フレームワークバージョン

📄 ライセンス