G

Gigaam Ctc With Lm

waveletdeboshirによって開発
ロシア語自動音声認識モデル、外部ngram言語モデルとビームサーチデコードをサポート、単語レベルのタイムスタンプ抽出可能
ダウンロード数 30
リリース時間 : 5/13/2025

モデル概要

これはConformerアーキテクチャに基づくロシア語音声認識モデルで、transformersライブラリインターフェースを統合し、外部ngram言語モデルを使用したリスコアリングとビームサーチデコードをサポートし、単語レベルのタイムスタンプ抽出機能も備えています。

モデル特徴

言語モデル統合
外部ngram言語モデルによるリスコアリングをサポートし、認識精度を向上
ビームサーチデコード
ビームサーチアルゴリズムを使用したデコードで、認識結果を最適化
タイムスタンプ抽出
単語レベルのタイムスタンプを抽出可能、音声アライメント分析をサポート
Transformers互換
Hugging Face transformersライブラリと完全互換で、統合が容易

モデル能力

ロシア語音声認識
音声テキスト変換
単語レベルのタイムスタンプ抽出

使用事例

音声文字起こし
ロシア語会議議事録
ロシア語会議録音を自動的に文字記録に変換
タイムスタンプ付きの会議議事録を生成
メディア字幕生成
ロシア語動画コンテンツに自動的に字幕を生成
同期された字幕ファイル
音声分析
音声コンテンツ分析
ロシア語音声コンテンツを分析しキーワードを抽出
時間タグ付きのキーワードリスト
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase