llama-68mオープンソース小型言語モデル - 推測推論研究を支援し、無料で利用可能！

ホーム

Llama 68m

JackFramによって開発

これはLLaMAに似た小型言語モデルで、6800万のパラメータを含み、主にSpecInfer論文における推論推測研究に使用されます。

大規模言語モデル

Transformers

英語オープンソースライセンス:Apache-2.0 #小規模テキスト生成 #推論推測の高速化 #ウィキペディアトレーニング

ダウンロード数 573.35k

リリース時間 : 7/19/2023

モデル概要

ウィキペディアと一部のC4データセットでトレーニングされた軽量言語モデルで、SpecInfer論文の基礎推測モデルとして開発されました。

モデル特徴

軽量設計

わずか6800万パラメータの小型モデルで、推論推測の基礎モデルとして適しています

複数データソースでのトレーニング

ウィキペディア、C4-en、C4-realnewslikeデータセットを組み合わせてトレーニング

研究指向

SpecInfer論文における推論推測とトークンツリー検証研究のために特別に設計

モデル能力

英語テキスト生成

使用事例

学術研究

推論推測研究

SpecInfer論文における基礎小型推測モデルとして

推論推測とトークンツリー検証方法の有効性を検証するために使用

軽量アプリケーション

リソース制約環境下でのテキスト生成

計算リソースが限られている状況で基本的なテキスト生成能力を提供

プロパティ	詳細
モデルタイプ	LLaMAライクなモデル
訓練データ	Wikipedia、C4-en、C4-realnewslikeデータセットの一部

おすすめAIモデル

Llama 3 Typhoon V1.5x 8b Instruct

タイ語専用に設計された80億パラメータの命令モデルで、GPT-3.5-turboに匹敵する性能を持ち、アプリケーションシナリオ、検索拡張生成、制限付き生成、推論タスクを最適化

Cadet-TinyはSODAデータセットでトレーニングされた超小型対話モデルで、エッジデバイス推論向けに設計されており、体積はCosmo-3Bモデルの約2％です。

Roberta Base Chinese Extractive Qa

RoBERTaアーキテクチャに基づく中国語抽出型QAモデルで、与えられたテキストから回答を抽出するタスクに適しています。

質問応答システム中国語

uer

2,694

未来を切り開く、あなたのAIソリューション知識ベース

English 简体中文繁體中文にほんご

Llama 68m

モデル概要

モデル特徴

モデル能力

使用事例

🚀 小型言語モデル

🚀 クイックスタート

📚 ドキュメント

モデル概要

引用

データセット情報

重要提示

📄 ライセンス