Fullstop Catalan Punctuation Prediction
F
Fullstop Catalan Punctuation Prediction
由softcatala開發
該模型用於預測加泰羅尼亞語的標點符號,能夠還原句號、逗號、問號、連字符和冒號等標點。
下載量 16
發布時間 : 4/4/2022
模型概述
基於深度學習的加泰羅尼亞語標點符號預測模型,專為處理無標點文本設計,可自動添加適當的標點符號。
模型特點
多標點類型支持
能夠預測並還原五種不同類型的標點符號,包括句號、逗號、問號、連字符和冒號。
高準確率
在加泰羅尼亞語上表現出色,特別是對句號的預測準確率高達93%。
基於Europarl數據集
使用高質量的Europarl加泰羅尼亞語數據集進行訓練,確保了模型的可靠性。
模型能力
加泰羅尼亞語文本標點預測
無標點文本處理
自動標點符號插入
使用案例
文本處理
語音轉錄文本標點恢復
將語音識別系統生成的無標點文本自動添加適當的標點符號。
提高轉錄文本的可讀性和專業性
歷史文檔數字化
為數字化過程中丟失標點的歷史文檔恢復標點符號。
增強文檔的可讀性和研究價值
寫作輔助
快速寫作標點輔助
幫助用戶在快速寫作時自動添加標點,提高寫作效率。
減少寫作過程中的標點輸入負擔
精選推薦AI模型
Llama 3 Typhoon V1.5x 8b Instruct
專為泰語設計的80億參數指令模型,性能媲美GPT-3.5-turbo,優化了應用場景、檢索增強生成、受限生成和推理任務
大型語言模型
Transformers 支持多種語言

L
scb10x
3,269
16
Cadet Tiny
Openrail
Cadet-Tiny是一個基於SODA數據集訓練的超小型對話模型,專為邊緣設備推理設計,體積僅為Cosmo-3B模型的2%左右。
對話系統
Transformers 英語

C
ToddGoldfarb
2,691
6
Roberta Base Chinese Extractive Qa
基於RoBERTa架構的中文抽取式問答模型,適用於從給定文本中提取答案的任務。
問答系統 中文
R
uer
2,694
98