wav2vec2-xls-r-300m-as-CV8-v1オープンソースモデル - アッサム語の音声認識を高精度で実現

ホーム

Wav2vec2 Xls R 300m As CV8 V1

emreによって開発

facebook/wav2vec2-xls-r-300mをCommon Voice 8.0データセットでファインチューニングしたアッサム語(Assamese)音声認識モデル

音声認識

Transformers

その他オープンソースライセンス:Apache-2.0 #アッサム語音声認識 #多方言ロバスト性 #低リソース言語最適化

ダウンロード数 21

リリース時間 : 3/2/2022

モデル概要

このモデルはアッサム語の自動音声認識(ASR)タスク向けに最適化されたモデルで、wav2vec2-xls-r-300mアーキテクチャを基にファインチューニングされています。

モデル特徴

ロバストな音声認識

アッサム語向けに最適化された音声認識能力

Common Voiceデータベース

Mozilla Common Voice 8.0データセットを使用してトレーニング

大規模事前学習モデルのファインチューニング

3億パラメータのwav2vec2-xls-rモデルを基にファインチューニング

モデル能力

アッサム語音声認識

音声からテキストへの変換

使用事例

音声技術アプリケーション

アッサム語音声アシスタント

アッサム語音声インタラクションアプリの開発に使用

音声文字起こしサービス

アッサム語音声コンテンツをテキストに変換

Property	Details
Model Type	このモデルは、common_voiceデータセットでファインチューニングされたfacebook/wav2vec2-xls-r-300mのファインチューニングバージョンです。
Training Data	common_voice
Test WER	100.0

おすすめAIモデル

Llama 3 Typhoon V1.5x 8b Instruct

タイ語専用に設計された80億パラメータの命令モデルで、GPT-3.5-turboに匹敵する性能を持ち、アプリケーションシナリオ、検索拡張生成、制限付き生成、推論タスクを最適化

Cadet-TinyはSODAデータセットでトレーニングされた超小型対話モデルで、エッジデバイス推論向けに設計されており、体積はCosmo-3Bモデルの約2％です。

Roberta Base Chinese Extractive Qa

RoBERTaアーキテクチャに基づく中国語抽出型QAモデルで、与えられたテキストから回答を抽出するタスクに適しています。

質問応答システム中国語

uer

2,694

未来を切り開く、あなたのAIソリューション知識ベース

English 简体中文繁體中文にほんご

Wav2vec2 Xls R 300m As CV8 V1

モデル概要

モデル特徴

モデル能力

使用事例

🚀 wav2vec2-xls-r-300m-as-CV8-v1

🚀 クイックスタート

🔧 技術詳細

学習ハイパーパラメータ

フレームワークのバージョン

📄 ライセンス

モデル情報