低錯誤率

# 低錯誤率

Trocr Finetuned 20250422 125947

針對葡萄牙語文本優化的光學字符識別(OCR)模型，基於微軟TrOCR基礎模型微調

文字識別支持多種語言

Qaari 0.1 Urdu OCR VL 2B Instruct

Qaari 0.1 Urdu是一款專門為烏爾都語文本的光學字符識別（OCR）優化的模型，基於Qwen/Qwen2-VL-2B進行微調，在烏爾都語OCR能力上有顯著提升。

Qari OCR 0.1 VL 2B Instruct

基於Qwen2 VL模型微調的阿拉伯語OCR模型，專為整頁阿拉伯文本識別優化

Transformers 阿拉伯語

Fireredasr LLM L

FireRedASR是一系列支持普通話、中國方言和英語的開源工業級自動語音識別（ASR）模型，在公開的普通話ASR基準測試中實現了新的最先進水平（SOTA），同時具備出色的歌詞識別能力。

語音識別支持多種語言

Vntl Llama3 8b V2 Imatrix Gguf

基於LLaMA3 Youko的qlora微調版本，專為日文視覺小說英譯優化的8B參數模型

機器翻譯支持多種語言

Vntl Llama3 8b V2 Gguf

基於LLaMA 3 Youko的qlora微調版本，專精日語視覺小說英譯任務

機器翻譯支持多種語言

Reverb Diarization V2

Reverb說話人日誌V2是一個基於pyannote-audio的說話人日誌模型，相比基準pyannote3.0模型在多個測試集上表現更優。

說話人處理

Trocr Base Printed License Plates Ocr

基於microsoft/trocr-base-printed微調的印刷體車牌OCR模型，在評估集上字符錯誤率為0.037

基於字節級微調模型的阿拉伯語精確標音系統，通過微調預訓練模型實現阿拉伯文本發音符號的自動補全。

大型語言模型

Transformers 阿拉伯語

Wavlm Base 960h Asv19 Deepfake

基於微軟WavLM-base微調的深度偽造音頻檢測模型，在ASVspoof 2019數據集上表現優異，準確率達99.79%

Belle Whisper Large V3 Zh

基於whisper-large-v3微調優化的中文語音識別模型，在多箇中文語音基準測試中性能顯著提升

Trocr Large Spanish

基於Transformer架構的印刷體西班牙語OCR模型，專為印刷字體優化，不支持手寫體識別

圖像生成文本

Transformers 支持多種語言

Trocr Base Printed License Plates Ocr

基於microsoft/trocr-base-printed微調的OCR模型，專門用於識別印刷體車牌號碼。

Trocr Base Printed License Plates Ocr Timestamp

基於microsoft/trocr-base-printed微調的OCR模型，專門用於識別車牌和時間戳信息

Sinhala Ocr Model V3

該模型是基於Ransaka/sinhala-ocr-model微調的僧伽羅語OCR模型，主要用於識別僧伽羅語文本。

Wespeaker Voxceleb Resnet293 LM

基於ResNet293架構的說話人嵌入模型，經過大間隔微調優化，支持說話人識別、相似度計算和語音分割等任務

說話人處理英語

Whisper Large V3 German

基於Whisper Large v3的德語語音識別微調模型，針對德語語音處理和識別進行了優化

Transformers 德語

Trocr Base Printed Captcha Ocr

基於微軟trocr-base-printed模型微調的驗證碼識別模型，專門用於處理印刷體文本的OCR任務

Whisper Base Japanese

本模型使用Common Voice、JVS和JSUT數據集對openai/whisper-base進行日語微調，適用於日語語音識別任務。

Transformers 日語

ArOCR是一個阿拉伯語光學字符識別(OCR)模型，能夠將包含阿拉伯文本的圖像轉換為可編輯的文本格式。

Transformers 阿拉伯語

Trocr Handwritten Math

該模型能夠將手寫數學表達式的圖像轉換為對應的LaTeX序列，適用於數學公式識別和數字化處理。

Wav2vec2 Large Xlsr Japanese 0325 1200

這是一個基於facebook/wav2vec2-large-xlsr-53模型在日語語音識別任務上微調的自動語音識別(ASR)模型。

Transformers 日語

Wav2vec2 Xls R Adult Child Cls

基於XLS-R架構的音頻分類模型，用於區分成人和兒童語音。

Transformers 英語

精選推薦AI模型

Llama 3 Typhoon V1.5x 8b Instruct

專為泰語設計的80億參數指令模型，性能媲美GPT-3.5-turbo，優化了應用場景、檢索增強生成、受限生成和推理任務

大型語言模型

Transformers 支持多種語言

Cadet-Tiny是一個基於SODA數據集訓練的超小型對話模型，專為邊緣設備推理設計，體積僅為Cosmo-3B模型的2%左右。

Transformers 英語

Roberta Base Chinese Extractive Qa

基於RoBERTa架構的中文抽取式問答模型，適用於從給定文本中提取答案的任務。

問答系統中文

AIbase

智啟未來，您的人工智能解決方案智庫

English 简体中文繁體中文にほんご

© 2025AIbase