kobigbird-bert-baseオープンソース韓国語モデル - 長いシーケンスのテキストを処理し、最大4096の長さをサポートします

ホーム

Kobigbird Bert Base

monologgによって開発

疎な注意力に基づく韓国語Transformerモデルで、最大4096のシーケンスを処理できます。

大規模言語モデル

Transformers

韓国語#韓国語長テキスト処理 #疎な注意力機構 #BERTホットスタート

ダウンロード数 13.19k

リリース時間 : 3/2/2022

モデル概要

BigBirdは疎な注意力に基づくTransformerモデルで、BERTなどのモデルの長シーケンス処理能力を拡張し、特に韓国語テキスト処理に適しています。

モデル特徴

長シーケンス処理能力

最大4096のシーケンスを処理でき、従来のBERTモデルを大幅に上回ります。

効率的な注意力機構

通常の注意力の代わりにブロック疎な注意力機構を採用し、計算コストを大幅に削減します。

韓国語最適化

韓国語BERTチェックポイントに基づいてホットスタートトレーニングを行い、韓国語の特性に合わせて最適化されています。

柔軟な設定

全注意力モードと複数の疎な設定パラメータの調整をサポートします。

モデル能力

長テキスト処理

韓国語テキスト理解

シーケンスモデリング

使用事例

自然言語処理

長文書分析

長い韓国語文書（法律文書、学術論文など）を処理します。

長距離依存関係を効果的に捉えることができます。

韓国語テキスト分類

韓国語テキストの分類タスクを行います。

Property	Details
Language	Korean
Tags	korean
Mask Token	[MASK]
Widget Example	대한민국의 수도는 [MASK] 입니다.

おすすめAIモデル

Llama 3 Typhoon V1.5x 8b Instruct

タイ語専用に設計された80億パラメータの命令モデルで、GPT-3.5-turboに匹敵する性能を持ち、アプリケーションシナリオ、検索拡張生成、制限付き生成、推論タスクを最適化

Cadet-TinyはSODAデータセットでトレーニングされた超小型対話モデルで、エッジデバイス推論向けに設計されており、体積はCosmo-3Bモデルの約2％です。

Roberta Base Chinese Extractive Qa

RoBERTaアーキテクチャに基づく中国語抽出型QAモデルで、与えられたテキストから回答を抽出するタスクに適しています。

質問応答システム中国語

uer

2,694

未来を切り開く、あなたのAIソリューション知識ベース

English 简体中文繁體中文にほんご

Kobigbird Bert Base

モデル概要

モデル特徴

モデル能力

使用事例

🚀 KoBigBird

✨ 主な機能

🚀 クイックスタート

概要

注意事項

💻 使用例

基本的な使用法