T

T5 Base Multi Sentence Doctor

由flexudy開發
基於T5的模型,用於修正英語、德語和法語文本中的句子錯誤
下載量 341
發布時間 : 3/2/2022

模型概述

該模型旨在修復由OCR、文本提取或句子邊界檢測等工具產生的錯誤句子,能夠根據上下文重建正確的句子結構。

模型特點

多語言支持
可處理英語、德語和法語句子的修復任務
上下文感知修復
利用前後文信息進行更準確的句子重建
合成數據訓練
使用概率化隨機變換生成的合成數據進行訓練,增強模型魯棒性

模型能力

修復OCR錯誤
修正句子邊界錯誤
句子級拼寫修正
上下文感知文本重建

使用案例

文本處理
OCR後處理
修復掃描文檔中因OCR識別產生的錯誤句子
將'm a medical doct'修復為'I am a medical doctor'
句子邊界修正
糾正錯誤的句子分割結果
將錯誤分句'That is my job I a'和'm a medical doct'合併修復為完整句子
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase