wav2vec2-large-it-voxpopuliオープンソース音声認識モデル - 無料でイタリア語の音声認識をサポート

ホーム

Wav2vec2 Large It Voxpopuli

facebookによって開発

VoxPopuliイタリア語無注釈データで事前学習された音声認識モデル、FacebookのWav2Vec2アーキテクチャを採用

音声認識その他#イタリア語音声認識 #教師なし事前学習 #マルチシーン音声処理

ダウンロード数 55

リリース時間 : 3/2/2022

モデル概要

このモデルはFacebook Wav2Vec2大型モデルのイタリア語実装で、イタリア語音声データに最適化されており、自動音声認識タスクに適しています。

モデル特徴

大規模事前学習

VoxPopuliコーパスのイタリア語無注釈サブセットで事前学習されており、強力な音声特徴抽出能力を有する

多言語アーキテクチャ

XLSR-53アーキテクチャを採用し、言語横断的音声認識をサポート

微調整可能

特定の分野やアクセントに合わせた微調整が可能で、認識精度を向上

モデル能力

イタリア語音声認識

生音声処理

音声特徴抽出

使用事例

音声書き起こし

会議議録自動化

イタリア語会議録音を自動的に文字記録に変換

メディア字幕生成

イタリア語動画コンテンツに自動的に字幕を生成

音声アシスタント

イタリア語音声コマンド認識

イタリア語対応スマートホームや車載システムの音声コマンド認識に使用

属性	详情
タグ	audio, automatic-speech-recognition, voxpopuli
ライセンス	cc-by-nc-4.0

おすすめAIモデル

Llama 3 Typhoon V1.5x 8b Instruct

タイ語専用に設計された80億パラメータの命令モデルで、GPT-3.5-turboに匹敵する性能を持ち、アプリケーションシナリオ、検索拡張生成、制限付き生成、推論タスクを最適化

Cadet-TinyはSODAデータセットでトレーニングされた超小型対話モデルで、エッジデバイス推論向けに設計されており、体積はCosmo-3Bモデルの約2％です。

Roberta Base Chinese Extractive Qa

RoBERTaアーキテクチャに基づく中国語抽出型QAモデルで、与えられたテキストから回答を抽出するタスクに適しています。

質問応答システム中国語

uer

2,694

未来を切り開く、あなたのAIソリューション知識ベース

English 简体中文繁體中文にほんご

Wav2vec2 Large It Voxpopuli

モデル概要

モデル特徴

モデル能力

使用事例

🚀 Wav2Vec2-Large-VoxPopuli

🚀 クイックスタート

📚 ドキュメント

論文情報

微調整について

📄 ライセンス