T

Tavbert Tr

tauによって開発
トルコ語向けのBERTスタイルのマスク言語モデルで、文字レベルで動作し、SpanBERTのような文字スパンマスク手法を用いて事前学習されています。
ダウンロード数 15
リリース時間 : 4/9/2022

モデル概要

TavBERTはトルコ語専用に設計された事前学習言語モデルで、文字レベルの処理方式を採用し、トルコ語の形態論的特性をより適切に処理できます。

モデル特徴

文字レベル処理
単語レベルではなく文字レベルで処理を行うため、トルコ語の形態論的特性に適しています
スパンマスク事前学習
SpanBERTのような文字スパンマスク手法を使用して事前学習を行い、モデルの性能を向上させます
大規模トレーニングデータ
OSCARのトルコ語部分(27GBのテキスト)に基づいてトレーニングされています

モデル能力

トルコ語テキスト理解
マスク言語モデリング
文字レベル予測

使用事例

自然言語処理
トルコ語テキスト補完
マスクされたトルコ語テキストの断片を予測します
マスクされた文字シーケンスを正確に予測できます
トルコ語言語モデル
下流のNLPタスクのベースモデルとして使用します
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase