S

Sage Fredt5 Distilled 95m

由ai-forever開發
基於FRED-T5-1.7B架構的蒸餾模型,用於俄語拼寫、標點及大小寫錯誤的自動校正
下載量 1,553
發布時間 : 3/11/2024

模型概述

該模型通過將文本中的所有單詞規範化為俄語標準形式,糾正拼寫、標點錯誤及打字錯誤。訓練採用了包含人工錯誤的廣泛數據集,適用於多種文本糾錯場景。

模型特點

多錯誤類型校正
同時處理拼寫錯誤、標點錯誤和大小寫錯誤
合成數據訓練
使用SAGE庫自動生成訓練數據中的錯誤,覆蓋廣泛錯誤類型
領域適應性
在通用文本和特定領域(如醫學)都表現良好

模型能力

俄語拼寫校正
標點符號修正
大小寫規範化
打字錯誤糾正

使用案例

文本處理
社交媒體文本校正
修正用戶生成內容中的拼寫和語法錯誤
在LiveJournal數據集上F1達到78.9
專業文檔校對
自動檢查醫學文檔等專業文本
在醫學數據集上F1達到64.9
內容生產
自動字幕校正
修正視頻轉錄文本中的錯誤
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase