wav2vec2 - संस्कृत - stt オープンソースのサンスクリット語音声認識モデル - 無料でサンスクリット語の音声を瞬時にテキストに変換

ホーム

Wav2vec2 Sanskrit Stt

addy88によって開発

Wav2Vec2アーキテクチャに基づくサンスクリット音声認識モデルで、サンスクリット音声をテキストに変換できます

音声認識

Transformers

#サンスクリット音声認識 #言語モデル非依存 #Wav2Vec2アーキテクチャ

ダウンロード数 15

リリース時間 : 3/2/2022

モデル概要

このモデルはサンスクリットに最適化された自動音声認識(ASR)システムで、FacebookのWav2Vec2アーキテクチャをファインチューニングし、サンスクリット音声からテキストへの変換タスク専用に設計されています。

モデル特徴

サンスクリット専用

サンスクリット音声に特化して最適化された音声認識モデル

Wav2Vec2ベース

FacebookのWav2Vec2アーキテクチャを使用し、強力な音声特徴抽出能力を備えています

エンドツーエンド認識

中間処理ステップなしで、生の音声入力から直接テキスト出力を生成します

モデル能力

サンスクリット音声認識

音声からテキストへの変換

音声コンテンツの文字起こし

使用事例

学術研究

サンスクリット文献のデジタル化

サンスクリットの音声録音を検索可能なテキスト形式に変換

学術研究や文献保存に便利

文化保護

サンスクリット口承伝統の記録

サンスクリットの口承伝統や宗教的な詠唱を記録・保存

絶滅危機言語の文化遺産保護に貢献

おすすめAIモデル

Llama 3 Typhoon V1.5x 8b Instruct

タイ語専用に設計された80億パラメータの命令モデルで、GPT-3.5-turboに匹敵する性能を持ち、アプリケーションシナリオ、検索拡張生成、制限付き生成、推論タスクを最適化

Cadet-TinyはSODAデータセットでトレーニングされた超小型対話モデルで、エッジデバイス推論向けに設計されており、体積はCosmo-3Bモデルの約2％です。

Roberta Base Chinese Extractive Qa

RoBERTaアーキテクチャに基づく中国語抽出型QAモデルで、与えられたテキストから回答を抽出するタスクに適しています。

質問応答システム中国語

uer

2,694

未来を切り開く、あなたのAIソリューション知識ベース

English 简体中文繁體中文にほんご

Wav2vec2 Sanskrit Stt

モデル概要

モデル特徴

モデル能力

使用事例

🚀 音声文字起こしモデル

🚀 クイックスタート

💻 使用例

基本的な使用法