B

Babyberta 3

由phueb開發
BabyBERTa 是基於 RoBERTa 的輕量級版本,專為語言習得研究設計,訓練數據為 500 萬單詞的美國英語兒童導向輸入語料。
下載量 22
發布時間 : 3/2/2022

模型概述

BabyBERTa 是一個輕量級的語言模型,基於 RoBERTa 架構,專為研究兒童語言習得而開發。它能夠在單臺配備單個 GPU 的桌面電腦上運行,無需高性能計算基礎設施。

模型特點

輕量級設計
模型專為在單臺配備單個 GPU 的桌面電腦上運行而設計,無需高性能計算基礎設施。
兒童導向輸入
訓練數據為 500 萬單詞的美國英語兒童導向輸入語料,適合語言習得研究。
語法知識學習
模型專為從兒童導向輸入中學習語法知識而開發,通過 Zorro 測試套件進行評估。
訓練優化
在訓練過程中從不預測未掩碼標記(unmask_prob 參數設置為零)。

模型能力

語言建模
語法知識學習
兒童語言習得研究

使用案例

語言習得研究
兒童語言發展研究
使用 BabyBERTa 分析兒童導向輸入中的語法知識學習過程。
在 Zorro 測試套件上達到 80.3 的整體準確率。
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase