M

Muril Large Cased

googleによって開発
BERT大型アーキテクチャに基づく多言語インド言語の事前学習モデルで、17種類のインド言語とその転写バージョンをカバーしています。
ダウンロード数 6,307
リリース時間 : 3/2/2022

モデル概要

MuRILはインド言語向けに最適化された多言語表現モデルで、翻訳と転写データを統合することで低リソース言語の性能を向上させ、インド言語のNLPタスクに適しています。

モデル特徴

多言語転写最適化
元のテキストと転写テキストのペアを同時に学習し、インドで一般的な言語転写現象を専門的に処理します。
低リソース言語の強化
0.3の指数アップサンプリング戦略を採用し、低リソース言語のモデル性能を大幅に向上させます。
平行データ学習
翻訳データ(Google NMT)と転写データ(IndicTrans)を統合して共同学習を行います。

モデル能力

多言語テキストの理解
言語間転写処理
固有表現抽出
テキスト分類
質問応答システム

使用事例

政府サービス
多言語政策文書分析
インドの異なる言語バージョンの政府文書を処理します。
PANXタスクのF1値が77.7%に達します。
教育
言語間教育資源処理
異なるインド言語バージョンの教育資料を自動的に処理します。
TyDiQAタスクのF1値が3%向上します。
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase