Sikubertオープンソース古書処理用事前学習モデル - 《四庫全書》などの古書の自動処理を無料でサポート

ホーム

Sikubert

SIKU-BERTによって開発

古籍の自動処理に特化した事前学習言語モデルで、BERTアーキテクチャに基づき、『四庫全書』の高品質コーパスを使用して学習されました。

大規模言語モデル

Transformers

中国語オープンソースライセンス:Apache-2.0 #古籍処理 #文言文理解 #BERTアーキテクチャ

ダウンロード数 1,900

リリース時間 : 3/2/2022

モデル概要

古漢語の知能処理タスクに対応した事前学習言語モデルで、文言文や古代漢語の自然言語処理をサポートします。

モデル特徴

古籍専用

古代漢語や文言文に特化して最適化された事前学習モデル

高品質コーパス

権威ある『四庫全書』の全文を学習コーパスとして使用しています。

ダブルアーキテクチャサポート

BERTとRoBERTaの2種類のアーキテクチャの事前学習モデルを提供します。

モデル能力

文言文理解

古籍文本マイニング

古代漢語情報処理

使用事例

デジタルヒューマニティ研究

古籍文本分析

古代文献の自動分析と情報抽出

歴史文献処理

各種歴史文献資料の処理と分析

教育研究

古代漢語教育支援

古代漢語や文言文の教育と研究を支援します。

おすすめAIモデル

Llama 3 Typhoon V1.5x 8b Instruct

タイ語専用に設計された80億パラメータの命令モデルで、GPT-3.5-turboに匹敵する性能を持ち、アプリケーションシナリオ、検索拡張生成、制限付き生成、推論タスクを最適化

Cadet-TinyはSODAデータセットでトレーニングされた超小型対話モデルで、エッジデバイス推論向けに設計されており、体積はCosmo-3Bモデルの約2％です。

Roberta Base Chinese Extractive Qa

RoBERTaアーキテクチャに基づく中国語抽出型QAモデルで、与えられたテキストから回答を抽出するタスクに適しています。

質問応答システム中国語

uer

2,694

未来を切り開く、あなたのAIソリューション知識ベース

English 简体中文繁體中文にほんご

Sikubert

モデル概要

モデル特徴

モデル能力

使用事例

🚀 SikuBERT

🚀 クイックスタート

💻 使用例

基本的な使用法

📚 ドキュメント

📄 ライセンス