fullstop-catalan-punctuation-predictionオープンソースモデル - カタルーニャ語の句読点を高精度で予測

ホーム

Fullstop Catalan Punctuation Prediction

softcatalaによって開発

このモデルはカタルーニャ語の句読点を予測し、ピリオド、カンマ、疑問符、ハイフン、コロンなどの句読点を復元できます。

シーケンスラベリング

Transformers

その他#カタルーニャ語専用 #複数句読点復元 #高精度ピリオド予測

ダウンロード数 16

リリース時間 : 4/4/2022

モデル概要

ディープラーニングに基づくカタルーニャ語句読点予測モデルで、句読点のないテキスト処理専用に設計されており、適切な句読点を自動的に追加します。

モデル特徴

複数句読点タイプサポート

ピリオド、カンマ、疑問符、ハイフン、コロンなど5種類の異なる句読点を予測・復元できます。

高精度

カタルーニャ語において優れた性能を発揮し、特にピリオドの予測精度は93%に達します。

Europarlデータセットに基づく

高品質なEuroparlカタルーニャ語データセットを使用してトレーニングされており、モデルの信頼性を確保しています。

モデル能力

カタルーニャ語テキスト句読点予測

句読点なしテキスト処理

自動句読点挿入

使用事例

テキスト処理

音声転記テキスト句読点復元

音声認識システムで生成された句読点なしテキストに自動的に適切な句読点を追加します。

転記テキストの可読性と専門性を向上

歴史文書デジタル化

デジタル化過程で失われた句読点を歴史文書に復元します。

文書の可読性と研究価値を強化

執筆支援

迅速執筆句読点支援

ユーザーが迅速に執筆する際に自動的に句読点を追加し、執筆効率を向上させます。

執筆過程における句読点入力負担を軽減

ラベル	カタルーニャ語 (CA)
0	0.99
.	0.93
,	0.82
?	0.76
-	0.89
:	0.64
マクロ平均	0.84

おすすめAIモデル

Llama 3 Typhoon V1.5x 8b Instruct

タイ語専用に設計された80億パラメータの命令モデルで、GPT-3.5-turboに匹敵する性能を持ち、アプリケーションシナリオ、検索拡張生成、制限付き生成、推論タスクを最適化

Cadet-TinyはSODAデータセットでトレーニングされた超小型対話モデルで、エッジデバイス推論向けに設計されており、体積はCosmo-3Bモデルの約2％です。

Roberta Base Chinese Extractive Qa

RoBERTaアーキテクチャに基づく中国語抽出型QAモデルで、与えられたテキストから回答を抽出するタスクに適しています。

質問応答システム中国語

uer

2,694

未来を切り開く、あなたのAIソリューション知識ベース

English 简体中文繁體中文にほんご

Fullstop Catalan Punctuation Prediction

モデル概要

モデル特徴

モデル能力

使用事例

🚀 カタルーニャ語句読点予測モデル

🚀 クイックスタート

✨ 主な機能

📚 ドキュメント

結果

📄 連絡先