roberta-large-japanese-aozora オープンソース日本語モデル - 青空文庫に基づくファインチューニングで様々なタスクに対応

ホーム

Roberta Large Japanese Aozora

KoichiYasuokaによって開発

青空文庫テキストで事前学習されたRoBERTa大型日本語モデル、下流タスクのファインチューニングに対応

大規模言語モデル

Transformers

日本語#日本語テキスト埋め込み #青空文庫事前学習 #長単位分かち書き

ダウンロード数 17

リリース時間 : 3/2/2022

モデル概要

これは青空文庫テキストを基に、Japanese-LUW-Tokenizerを使用して事前学習されたRoBERTa大型日本語モデルで、品詞タグ付けや依存構文解析などの下流タスクに利用可能です。

モデル特徴

青空文庫による事前学習

日本の青空文庫の高品質なテキストデータを使用して事前学習されており、豊富な言語特徴を有する

下流タスクのファインチューニング対応

品詞タグ付けや依存構文解析など、様々な自然言語処理タスクに適用可能

専門分かち書きツール対応

Japanese-LUW-Tokenizerを採用しており、日本語テキスト処理に最適化されている

モデル能力

日本語テキスト理解

マスク言語モデリング

品詞タグ付け

依存構文解析

使用事例

自然言語処理

日本語テキスト分析

日本語テキストの文法構造や意味関係を分析するために使用

日本語教育支援

日本語学習ツールとして活用可能で、複雑な文構造の理解を支援

おすすめAIモデル

Llama 3 Typhoon V1.5x 8b Instruct

タイ語専用に設計された80億パラメータの命令モデルで、GPT-3.5-turboに匹敵する性能を持ち、アプリケーションシナリオ、検索拡張生成、制限付き生成、推論タスクを最適化

Cadet-TinyはSODAデータセットでトレーニングされた超小型対話モデルで、エッジデバイス推論向けに設計されており、体積はCosmo-3Bモデルの約2％です。

Roberta Base Chinese Extractive Qa

RoBERTaアーキテクチャに基づく中国語抽出型QAモデルで、与えられたテキストから回答を抽出するタスクに適しています。

質問応答システム中国語

uer

2,694

未来を切り開く、あなたのAIソリューション知識ベース

English 简体中文繁體中文にほんご

Roberta Large Japanese Aozora

モデル概要

モデル特徴

モデル能力

使用事例

🚀 roberta-large-japanese-aozora

🚀 クイックスタート

💻 使用例

基本的な使用法

📚 ドキュメント

モデル概要

参考文献

📄 ライセンス