codeswitch-hineng-lid-linceオープンソース事前学習モデル - ヒンディー語と英語のコードスイッチングデータの言語を正確に識別

ホーム

Codeswitch Hineng Lid Lince

sagorsarkerによって開発

これは、ヒンディー語 - 英語のコード混合データの言語識別に特化した事前学習モデルです。

シーケンスラベリング複数言語対応オープンソースライセンス:MIT #ヒンディー語 - 英語のコードスイッチング #言語識別 #多言語処理

ダウンロード数 85

リリース時間 : 3/2/2022

モデル概要

このモデルはLinCEデータセットを基に訓練され、ヒンディー語と英語の混合テキスト中の言語成分を識別できます。

モデル特徴

ヒンディー語 - 英語のコード混合識別

ヒンディー語と英語の混合テキストの言語成分識別に特化しています。

LinCEデータセットを基に

標準化されたコード混合データセットを使用して訓練されています。

使いやすい

pipelineを直接使用する方法と専用ライブラリを使用する方法の2種類の呼び出し方法を提供します。

モデル能力

言語識別

コード混合分析

ヒンディー語 - 英語の混合テキスト処理

使用事例

自然言語処理

ソーシャルメディアテキスト分析

ヒンディー語 - 英語の混合ソーシャルメディアコンテンツを分析します。

テキスト中の言語成分を正確に識別します。

多言語アプリケーション開発

ヒンディー語 - 英語の混合入力をサポートするアプリに言語識別機能を提供します。

おすすめAIモデル

Llama 3 Typhoon V1.5x 8b Instruct

タイ語専用に設計された80億パラメータの命令モデルで、GPT-3.5-turboに匹敵する性能を持ち、アプリケーションシナリオ、検索拡張生成、制限付き生成、推論タスクを最適化

Cadet-TinyはSODAデータセットでトレーニングされた超小型対話モデルで、エッジデバイス推論向けに設計されており、体積はCosmo-3Bモデルの約2％です。

Roberta Base Chinese Extractive Qa

RoBERTaアーキテクチャに基づく中国語抽出型QAモデルで、与えられたテキストから回答を抽出するタスクに適しています。

質問応答システム中国語

uer

2,694

未来を切り開く、あなたのAIソリューション知識ベース

English 简体中文繁體中文にほんご

Codeswitch Hineng Lid Lince

モデル概要

モデル特徴

モデル能力

使用事例

🚀 コードスイッチ - ヒンディー語 - 英語言語識別モデル (codeswitch-hineng-lid-lince)

🚀 クイックスタート

📦 インストール

💻 使用例

基本的な使用法

📄 ライセンス