BERTweet - Covid19オープンソース言語モデル、無料でデプロイして簡単にソーシャルメディアの英語ツイートを処理

ホーム

Bertweet Covid19 Base Uncased

vinaiによって開発

BERTweetは英語ツイート向けに事前学習された初の大規模公開言語モデルで、RoBERTaアーキテクチャを基に最適化され、ソーシャルメディアテキストに特化しています。

大規模言語モデルオープンソースライセンス:MIT #英語ツイート分析 #ソーシャルメディアNLP #COVID-19世論

ダウンロード数 15

リリース時間 : 3/2/2022

モデル概要

BERTweetは英語ツイート向けに最適化された事前学習言語モデルで、ソーシャルメディアテキスト分析タスクに適しています。

モデル特徴

ソーシャルメディア専用

ツイートの特徴に特化して最適化されており、ソーシャルメディアテキストの非公式表現、略語、ハッシュタグをより適切に処理できます。

大規模トレーニングデータ

8.5億件の英語ツイート（160億トークン）を使用して事前学習を行い、COVID-19関連ツイートを含みます。

RoBERTa最適化

RoBERTaの事前学習方法に基づいて構築され、より効率的なトレーニング戦略を採用しています。

モデル能力

ツイートテキスト理解

ソーシャルメディア感情分析

トピック分類

固有表現認識

使用事例

ソーシャルメディア分析

パンデミック関連ツイート分析

COVID-19関連ツイートにおける一般感情や関心事の分析

ブランド世論モニタリング

ソーシャルメディア上での特定ブランドに関する議論の監視と分析

自然言語処理研究

ソーシャルメディア言語モデル研究

ソーシャルメディアテキスト処理関連研究のベンチマークモデルとして使用

おすすめAIモデル

Llama 3 Typhoon V1.5x 8b Instruct

タイ語専用に設計された80億パラメータの命令モデルで、GPT-3.5-turboに匹敵する性能を持ち、アプリケーションシナリオ、検索拡張生成、制限付き生成、推論タスクを最適化

Cadet-TinyはSODAデータセットでトレーニングされた超小型対話モデルで、エッジデバイス推論向けに設計されており、体積はCosmo-3Bモデルの約2％です。

Roberta Base Chinese Extractive Qa

RoBERTaアーキテクチャに基づく中国語抽出型QAモデルで、与えられたテキストから回答を抽出するタスクに適しています。

質問応答システム中国語

uer

2,694

未来を切り開く、あなたのAIソリューション知識ベース

English 简体中文繁體中文にほんご

Bertweet Covid19 Base Uncased

モデル概要

モデル特徴

モデル能力

使用事例

🚀 BERTweet: 英語のツイート用の事前学習言語モデル

📄 ライセンス