Kategoriopoiitis Ellinikon Poikilion
模型概述
該模型能夠準確識別希臘語的不同歷史變體和現代變體,適用於語言學研究、文本分類和歷史文獻分析等場景。
模型特點
高準確率
模型在訓練1個週期後即達到94%的準確率,表現優異。
多源數據訓練
訓練數據來自Project Gutenberg、Europarl、Wiki、HNC、Bible、GlobalVoices和ParaCrawl等多個來源,覆蓋廣泛。
專業標註
由語言學家團隊根據希臘語的三種現代變體和古希臘語時期標註了5,020個文本片段,確保分類準確性。
模型能力
希臘語文本分類
歷史變體識別
現代變體識別
使用案例
語言學研究
歷史文獻分析
識別古代和中世紀希臘語文本,幫助語言學家研究希臘語的歷史演變。
準確分類古代/中世紀希臘語文本。
現代希臘語變體分析
區分標準現代希臘語、通俗希臘語和純正希臘語,用於社會語言學研究。
準確分類現代希臘語變體。
文本處理
文本分類
自動分類希臘語文本到不同的變體類別,用於內容管理和檢索。
高效準確的文本分類。
精選推薦AI模型
Llama 3 Typhoon V1.5x 8b Instruct
專為泰語設計的80億參數指令模型,性能媲美GPT-3.5-turbo,優化了應用場景、檢索增強生成、受限生成和推理任務
大型語言模型
Transformers 支持多種語言

L
scb10x
3,269
16
Cadet Tiny
Openrail
Cadet-Tiny是一個基於SODA數據集訓練的超小型對話模型,專為邊緣設備推理設計,體積僅為Cosmo-3B模型的2%左右。
對話系統
Transformers 英語

C
ToddGoldfarb
2,691
6
Roberta Base Chinese Extractive Qa
基於RoBERTa架構的中文抽取式問答模型,適用於從給定文本中提取答案的任務。
問答系統 中文
R
uer
2,694
98