icefall-asr-gigaspeech-conformer-ctcオープンソースASRツール - 効率的で柔軟に音声認識タスクを完了する

ホーム

Icefall Asr Gigaspeech Conformer Ctc

speechcolabによって開発

Icefallはk2フレームワークに基づく自動音声認識（ASR）ツールキットで、効率的で柔軟な音声認識モデルのトレーニングと推論に焦点を当てています。

音声認識英語#大規模音声認識 #高精度書き起こし #多シーン適応

ダウンロード数 0

リリース時間 : 6/30/2022

モデル概要

Icefallはk2フレームワーク上に構築された自動音声認識（ASR）のためのツールキットで、効率的なモデルトレーニングと推論をサポートします。さまざまな音声認識タスクに適しており、柔軟な設定オプションを提供します。

モデル特徴

効率的なトレーニングと推論

k2フレームワークに基づき、Icefallは大規模な音声認識タスクに適した効率的なトレーニングと推論能力を提供します。

柔軟な設定

さまざまなモデル設定とパラメータ調整をサポートし、ユーザーがニーズに応じて音声認識モデルをカスタマイズしやすくなっています。

多様な音声認識タスクに対応

リアルタイム音声認識やオフライン音声認識など、さまざまな音声認識シナリオに適用可能です。

モデル能力

音声認識

音声処理

モデルトレーニング

モデル推論

使用事例

音声からテキストへ

リアルタイム音声からテキストへ

リアルタイムの音声ストリームをテキストに変換し、会議の議事録やリアルタイム字幕などのシナリオに適しています。

高精度なリアルタイム音声認識

オフライン音声からテキストへ

録音された音声ファイルを音声認識し、テキスト記録を生成します。

効率的なオフライン音声処理

音声アシスタント

音声コマンド認識

ユーザーの音声コマンドを認識し、スマートホームや車載システムなどのシナリオで使用します。

迅速な応答と高精度

属性	详情
タグ	k2、icefall、audio、automatic-speech-recognition
データセット	GigaSpeech

おすすめAIモデル

Llama 3 Typhoon V1.5x 8b Instruct

タイ語専用に設計された80億パラメータの命令モデルで、GPT-3.5-turboに匹敵する性能を持ち、アプリケーションシナリオ、検索拡張生成、制限付き生成、推論タスクを最適化

Cadet-TinyはSODAデータセットでトレーニングされた超小型対話モデルで、エッジデバイス推論向けに設計されており、体積はCosmo-3Bモデルの約2％です。

Roberta Base Chinese Extractive Qa

RoBERTaアーキテクチャに基づく中国語抽出型QAモデルで、与えられたテキストから回答を抽出するタスクに適しています。

質問応答システム中国語

uer

2,694

未来を切り開く、あなたのAIソリューション知識ベース

English 简体中文繁體中文にほんご

Icefall Asr Gigaspeech Conformer Ctc

モデル概要

モデル特徴

モデル能力

使用事例

🚀 タグ付きオーディオデータセット情報

📋 詳細情報