W

W2v2 Kaqchikel

sil-aiによって開発
facebook/wav2vec2-xls-r-300mを基にカクチケル語音声データでファインチューニングした音声認識モデル
ダウンロード数 21
リリース時間 : 4/26/2022

モデル概要

このモデルはカクチケル語に最適化された音声認識システムで、Deditosの動画クリップとBloom Libraryのオーディオブックデータを使用してファインチューニングされており、カクチケル語の自動音声テキスト変換タスクに適しています。

モデル特徴

低リソース言語サポート
カクチケル語のような低リソース言語に特化して最適化されています
複数データソースでのトレーニング
動画クリップとオーディオブックという異なるソースのトレーニングデータを組み合わせています
良好なパフォーマンス
評価セットで0.0854の文字誤り率と0.3069の単語誤り率を達成しました

モデル能力

カクチケル語音声認識
音声からテキストへの変換
低リソース言語処理

使用事例

教育
言語学習支援
カクチケル語学習者に発音評価と文字起こし機能を提供します
文化保護
先住民言語の文書化
カクチケル語の口承伝統を文字形式で保存するために転記します
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase