cursa-o1-7b-v1.1オープンソース事前学習言語モデル - 双モデルの強みを融合した実用的な選択肢

ホーム

Cursa O1 7b V1.1

marcuscedricridiaによって開発

これはSLERP法によって融合された事前学習言語モデルで、pre-cursa-o1-v1.2とpost-cursa-o1の2つのモデルの利点を組み合わせています。

大規模言語モデル

Transformers

#モデル融合 #SLERP補間 #自己注意最適化

ダウンロード数 40

リリース時間 : 2/28/2025

モデル概要

このモデルは球面線形補間(SLERP)法によって融合された事前学習言語モデルで、2つの基本モデルの利点を組み合わせ、言語理解と生成能力を向上させることを目的としています。

モデル特徴

モデル融合

SLERP法を用いて2つの事前学習モデルを融合し、それぞれの利点をバランスさせます

階層別パラメータ調整

異なる層（self_attn、mlpなど）に対して異なる融合パラメータを採用します

モデル能力

テキスト生成

言語理解

文脈推論

使用事例

自然言語処理

テキスト生成

一貫性のあるテキスト内容の生成に使用可能

質問応答システム

質問応答システムの構築に応用可能で、ユーザーの質問を理解し回答します

属性	详情
ベースモデル	marcuscedricridia/pre-cursa-o1-v1.2、marcuscedricridia/post-cursa-o1
ライブラリ名	transformers
タグ	mergekit、merge

おすすめAIモデル

Llama 3 Typhoon V1.5x 8b Instruct

タイ語専用に設計された80億パラメータの命令モデルで、GPT-3.5-turboに匹敵する性能を持ち、アプリケーションシナリオ、検索拡張生成、制限付き生成、推論タスクを最適化

Cadet-TinyはSODAデータセットでトレーニングされた超小型対話モデルで、エッジデバイス推論向けに設計されており、体積はCosmo-3Bモデルの約2％です。

Roberta Base Chinese Extractive Qa

RoBERTaアーキテクチャに基づく中国語抽出型QAモデルで、与えられたテキストから回答を抽出するタスクに適しています。

質問応答システム中国語

uer

2,694

未来を切り開く、あなたのAIソリューション知識ベース

English 简体中文繁體中文にほんご

Cursa O1 7b V1.1

モデル概要

モデル特徴

モデル能力

使用事例

🚀 モデルマージ

📚 ドキュメント

🔍 マージの詳細

マージ方法

マージされたモデル

設定