G

Gigaam Ctc With Lm

Developed by waveletdeboshir
ロシア語自動音声認識モデル、外部ngram言語モデルとビームサーチデコードをサポート、単語レベルのタイムスタンプ抽出可能
Downloads 30
Release Time : 5/13/2025

Model Overview

これはConformerアーキテクチャに基づくロシア語音声認識モデルで、transformersライブラリインターフェースを統合し、外部ngram言語モデルを使用したリスコアリングとビームサーチデコードをサポートし、単語レベルのタイムスタンプ抽出機能も備えています。

Model Features

言語モデル統合
外部ngram言語モデルによるリスコアリングをサポートし、認識精度を向上
ビームサーチデコード
ビームサーチアルゴリズムを使用したデコードで、認識結果を最適化
タイムスタンプ抽出
単語レベルのタイムスタンプを抽出可能、音声アライメント分析をサポート
Transformers互換
Hugging Face transformersライブラリと完全互換で、統合が容易

Model Capabilities

ロシア語音声認識
音声テキスト変換
単語レベルのタイムスタンプ抽出

Use Cases

音声文字起こし
ロシア語会議議事録
ロシア語会議録音を自動的に文字記録に変換
タイムスタンプ付きの会議議事録を生成
メディア字幕生成
ロシア語動画コンテンツに自動的に字幕を生成
同期された字幕ファイル
音声分析
音声コンテンツ分析
ロシア語音声コンテンツを分析しキーワードを抽出
時間タグ付きのキーワードリスト
AIbase
Empowering the Future, Your AI Solution Knowledge Base
© 2025AIbase