exp_w2v2t_th_hubert_s533オープンソースタイ語音声認識モデル - 無料でタイ語音声認識アプリをサポート

ホーム

Exp W2v2t Th Hubert S533

jonatasgrosmanによって開発

facebook/hubert-large-ll60kをベースにファインチューニングしたタイ語音声認識モデル、トレーニングデータはCommon Voice 7.0から取得

音声認識

Transformers

その他オープンソースライセンス:Apache-2.0 #タイ語音声認識 #HuBERTファインチューニング #16kHzサンプリングレート

ダウンロード数 19

リリース時間 : 7/8/2022

モデル概要

このモデルはタイ語自動音声認識(ASR)用のモデルで、HuBERTアーキテクチャをベースにファインチューニングされており、16kHzサンプリングレートの音声入力に適しています。

モデル特徴

タイ語音声認識

タイ語に特化して最適化された音声認識能力

HuBERTアーキテクチャベース

facebook/hubert-large-ll60kをベースモデルとしてファインチューニング

Common Voiceデータセットでトレーニング

Mozilla Common Voice 7.0データセットのタイ語部分を使用してトレーニング

モデル能力

タイ語音声からテキストへの変換

16kHzオーディオ処理

使用事例

音声文字起こし

タイ語音声の文字起こし

タイ語音声コンテンツをテキストに変換

音声アシスタント

タイ語音声コマンド認識

タイ語音声アシスタントや音声制御システムのコマンド認識に使用

属性	详情
モデルタイプ	音声認識用のファインチューニング済みモデル
トレーニングデータ	Common Voice 7.0 のトレーニング分割データ

おすすめAIモデル

Llama 3 Typhoon V1.5x 8b Instruct

タイ語専用に設計された80億パラメータの命令モデルで、GPT-3.5-turboに匹敵する性能を持ち、アプリケーションシナリオ、検索拡張生成、制限付き生成、推論タスクを最適化

Cadet-TinyはSODAデータセットでトレーニングされた超小型対話モデルで、エッジデバイス推論向けに設計されており、体積はCosmo-3Bモデルの約2％です。

Roberta Base Chinese Extractive Qa

RoBERTaアーキテクチャに基づく中国語抽出型QAモデルで、与えられたテキストから回答を抽出するタスクに適しています。

質問応答システム中国語

uer

2,694

未来を切り開く、あなたのAIソリューション知識ベース

English 简体中文繁體中文にほんご

Exp W2v2t Th Hubert S533

モデル概要

モデル特徴

モデル能力

使用事例

🚀 exp_w2v2t_th_hubert_s533

🚀 クイックスタート

✨ 主な機能

📄 ライセンス

📚 ドキュメント

モデル情報