Honyaku Multi Translator Swallow Ms7b
Swallow-MS-7bを基に開発された英日/日英双方向翻訳モデルで、中長文翻訳に特化し、一部多言語翻訳をサポート
ダウンロード数 22
リリース時間 : 3/30/2024
モデル概要
このモデルはSwallow-MS-7bの日本語能力を基に開発され、8Kコンテキストウィンドウで微調整されています。主に100から数千トークンの中長文翻訳シナリオを対象としています。英日相互翻訳が中核的な強みですが、他の言語の翻訳も一部サポートしています。
モデル特徴
中長文翻訳最適化
100トークンから数千トークンの中長文翻訳シナリオに最適化され、8Kコンテキストウィンドウをサポート
多言語サポート
英日相互翻訳の中核に加え、イタリア語、フランス語、スペイン語など多様な言語の翻訳をサポート
効率的なコマンド理解
XML風コマンドフォーマットを採用し、コマンドトークン消費が少なくモデルの理解が正確
モデル能力
英日双方向翻訳
日英双方向翻訳
多言語翻訳
中長文処理
使用事例
翻訳サービス
学術文献翻訳
国際法、経済政策などの専門分野の学術文献を翻訳
専門用語の正確性を保持し、複雑な構文を処理
ビジネス文書翻訳
多国籍企業の契約書、レポートなどのビジネス文書を翻訳
法律およびビジネス用語の正確な変換を確保
多言語コンテンツ処理
多言語コンテンツのローカライゼーション
英語から日本語または他のサポート言語へのコンテンツ翻訳
異なる言語の文化的表現習慣に適応
🚀 翻訳モデル Honyaku-7b-v2
この翻訳モデルは、Swallow-MS-7bの高い日本語力を活かし、英日・日英翻訳を中心に、多言語翻訳も一部サポートしています。長文翻訳にも対応しています。
🚀 クイックスタート
2024年4月8日に、多言語サポートを強化した新しいモデルをアップロードしました。
Honyaku-7b-v2
✨ 主な機能
- Swallow-MS-7bの高い日本語力を利用した翻訳モデルです。
- 主に英日翻訳を行い、8Kコンテキストでファインチューニングされています。
- 100トークンから数千トークンまでの比較的長文の翻訳を主目的としています。
- 多言語の翻訳も一部対応しています。
📦 インストール
インストールに関する具体的な手順は原READMEに記載されていないため、このセクションは省略されます。
💻 使用例
基本的な使用法
プロンプトフォーマット:英語から日本語
<english>: {} </english>
<japanese>: {} </japanese>
プロンプトフォーマット:日本語から英語
<japanese>: {} </japanese>
<english>: {} </english>
長文の場合、Textstreamerの使用をお勧めします。
import torch
from transformers import AutoModelForCausalLM, AutoTokenizer, TextStreamer
model_name = "aixsatoshi/Honyaku-Multi-Translator-Swallow-ms7b"
model = AutoModelForCausalLM.from_pretrained(
model_name,
torch_dtype=torch.bfloat16,
device_map="auto",
)
tokenizer = AutoTokenizer.from_pretrained(model_name)
# Define the streamer
streamer = TextStreamer(tokenizer)
# Define the English prompt
english_prompt = """
In an era marked by rapid globalization, the intricate interplay between international law, economic policies, and political dynamics has become increasingly complex.
Legal frameworks, once confined within national borders, now stretch across continents, necessitating a nuanced understanding of transnational legislation and treaties.
As multinational corporations navigate the labyrinthine maze of global markets, economic theories that underpin currency fluctuations, trade imbalances, and fiscal policies are more pertinent than ever.
Central to these economic considerations is the concept of market equilibrium, a delicate balance affected by myriad factors including consumer behavior, governmental regulations, and global crises.
Politically, the landscape is equally labyrinthine. Ideological shifts and the resurgence of nationalism have reshaped diplomatic relations, with international agreements and alliances being tested under the strain of geopolitical tensions.
The role of supranational entities like the United Nations and the European Union in mediating these conflicts is of paramount importance, as is the need for diplomatic finesse in an increasingly multipolar world.
Furthermore, the intersection of politics and economics is evident in the debate over economic sanctions and their efficacy in swaying political decisions.
In this context, understanding the subtleties of rhetoric used in political discourse, and how it interweaves with legal jargon and economic terminology, is crucial.
For instance, the rhetoric surrounding fiscal austerity measures often intertwines with legal discourse on budgetary legislation and economic debates on inflation control.
Similarly, discussions on constitutional amendments are frequently laden with political undertones, reflecting broader societal issues and ideological divides.
This convergence of legal, economic, and political vernacular presents a unique challenge for machine translation systems, demanding not only linguistic accuracy but also a deep comprehension of the nuanced interplay of these disciplines.
"""
# Prepare the prompt for English to Japanese translation
prompt = f"<english>: {english_prompt} </english>\n\n<japanese>:"
# Tokenize the input text and move to CUDA device
inputs = tokenizer(prompt, return_tensors="pt").to("cuda")
# Generate the output using the model and streamer
output = model.generate(**inputs, max_new_tokens=4096, do_sample=True, top_k=20, top_p=0.95, streamer=streamer)
高度な使用法
多言語対応
TAGは英日翻訳で動作します。他の機能タグは以下の通りです。
- <english>:
- <italian>:
- <french>:
- <spanish>:
- <Portuguese>:
- <German>:
- <Danish>:
- Nederlands:
- Czech :
以下の言語はあまりうまく動作せず、ほとんど不安定です。
- <Indonesian>:
- <Norwegian>:
- <Swedish>:
- <turkish>:
- Русский:
- Dutch:
- turkish:
- Vietnamese:
- ελληνική γλώσσα:
- Arabic:
- Vietnamese:
- Tiếng Việt:
- မြန်မာဘာသာ:
- Filipino:
以下の言語はほとんど動作しません。
- Finnish:
- Hindi:
- తెలుగు:
- አማርኛ:
- ພາສາລາວ:
翻訳例
<english>:In an era marked by rapid globalization, the intricate interplay between international law, economic policies, and political dynamics has become increasingly complex. Legal frameworks, once confined within national borders, now stretch across continents, necessitating a nuanced understanding of transnational legislation and treaties. As multinational corporations navigate the labyrinthine maze of global markets, economic theories that underpin currency fluctuations, trade imbalances, and fiscal policies are more pertinent than ever. Central to these economic considerations is the concept of market equilibrium, a delicate balance affected by myriad factors including consumer behavior, governmental regulations, and global crises.
Politically, the landscape is equally labyrinthine. Ideological shifts and the resurgence of nationalism have reshaped diplomatic relations, with international agreements and alliances being tested under the strain of geopolitical tensions. The role of supranational entities like the United Nations and the European Union in mediating these conflicts is of paramount importance, as is the need for diplomatic finesse in an increasingly multipolar world. Furthermore, the intersection of politics and economics is evident in the debate over economic sanctions and their efficacy in swaying political decisions.
In this context, understanding the subtleties of rhetoric used in political discourse, and how it interweaves with legal jargon and economic terminology, is crucial. For instance, the rhetoric surrounding fiscal austerity measures often intertwines with legal discourse on budgetary legislation and economic debates on inflation control. Similarly, discussions on constitutional amendments are frequently laden with political undertones, reflecting broader societal issues and ideological divides.
This convergence of legal, economic, and political vernacular presents a unique challenge for machine translation systems, demanding not only linguistic accuracy but also a deep comprehension of the nuanced interplay of these disciplines.
</english>
<japanese>:急速なグローバル化を特徴とする時代において、国際法、経済政策、政治的ダイナミクスの間の複雑な相互作用はますます複雑になっています。かつては国内国境内でのみ適用されていた法的枠組みが今や大陸を超えて広がっており、それらを理解するためには、国境を越えた法律や条約に関する繊細な理解が必要です。多国籍企業が世界市場の迷路をナビゲートしながら、通貨変動、貿易不均衡、財政政策などを裏付ける経済理論は、より重要性を増しています。これらの経済上の考慮事項の中心にあるのは、消費者行動、政府規制、そしてグローバル危機を含むさまざまな要因によって影響を受けるデリケートなバランスである市場平衡の概念です。
政治的に見ても、この地形も同様に複雑です。イデオロギーの変化とナショナリズムの復活により、外交関係が地政学的緊張の下で試練にさらされる中、国際協定や同盟が検査されています。国連や欧州連合などの超国家機関の仲介役としての役割は極めて重要であり、さらに、ますます多極化する世界における外交手腕の必要性も不可欠です。さらに、経済制裁の有効性についての議論の中でも、政治と経済の交差点が明らかです。
この文脈では、政治的討論で使用される口語表現の微妙な違いを理解し、それが法律用語や経済用語とどのように絡み合っているかを理解することが重要です。たとえば、緊縮財政措置にまつわる言説は、予算立法に関する法的議論やインフレ制御に関する経済議論と絡み合う傾向があります。また、憲法改正に関する議論には政治的ニュアンスが含まれていることが多く、社会全体の問題やイデオロギー的対立を反映しています。
このように、法律、経済、政治の言葉が融合した状況に対処するには、機械翻訳システムにとって独自の課題が生じます。言語的正確さだけでなく、これらの分野の微妙な相互作用の深い理解も求められます。
</japanese>
<french>:L’ère marquée par le rapide processus de mondialisation se caractérise par un jeu subtil entre la loi internationale, les politiques économiques et les dynamiques politiques qui sont plus complexes que jamais. Les législations nationales désormais s’étendent sur des continents nécessitant une compréhension fine des réglementations transnationaux et des traités internationaux. Dans le contexte des multinationaux qui naviguent dans le labyrinthe du marché mondial, les théories économiques fondées sur les fluctuations monétaires, les équilibres commerciaux et les politiques fiscales sont plus pertinent qu'ever. À leur centre, la notion d’équilibre du marché, affecté par un nombre sans cesse croissant de facteurs, notamment le comportement des consommateurs, les réglementations gouvernementales et les crises mondiales, est centrale.
Politiquement, la paysage est aussi labyrinthique. L’évolution des idées et du renouveau du nationalisme ont modifié les relations diplomatiques, où les accords internationaux et les alliances sont testées sous le poids de tensions géopolitiques. Le rôle des entités supra-nationales telles que l’Organisation des Nations Unies ou de l’Union européenne pour médier ces conflits est de premier plan, comme aussi bien la délicate diplomatie dans un monde devenu plus multipolaire. De plus, les liens de politique avec l’économie sont évidents lorsque la question de l’efficacité des mesures de blocade économique et de leurs impacts sur les décisions politiques est abordée.
Dans ce contexte, comprendre les subtilités du langage utilisé dans le discours politique ainsi que comment il se intègre aux termes juridiques et économiques est essentiel. Par exemple, le langage autour des mesures budgétaires de rigueur se mêle souvent à la discours législatif sur les lois budgétaires et au débat économique sur la lutte contre l’inflation. De même, les discussions sur les amendements constitutionnels sont souvent chargées de tonalité politique, reflétant des problèmes sociétaux plus larges et des divisions idéologiques.
Cette convergence de langages juridiques, économiques et politiques présente un défaut unique pour les systèmes de traduction machines, demandant non seulement la précision linguistique mais également une profonde compréhension de cette interactivité des disciplines.
</french>
< spanish>:La era de la globalización rápida ha marcado un cambio complejo en el interplay entre el derecho internacional, políticas económicas y dinámica política. Los marcos legales, una vez contenederos dentro de los límites nacionales, se extienden a través de continent, lo que necesita una comprensión minuciosa de las leyes transnacionales y tratados. En un mundo de empresas multinacionales, la economía está más relevante que nunca, ya que las teorías económicas subyacentes al cambio monetario, desequilibrios comerciales y políticas fiscales son más pertinentes que nunca. A estos aspectos económicos centrales es la idea del equilibrio del mercado, un equilibrio precuoque influenciado por factores tan variados como el comportamiento de los consumidores, reglamentaciones gubernamentales y crisis globales.
Políticamente, la escenografía es igualmente complicada. El cambio de paradigma ideológico y la reactivización del nacionalismo han alterado relaciones diplomáticas internacionales, sometidas al cernido de tensiones geopolíticas. La mediación de estos conflictos por entidades supranacionales como las Naciones Unidas o la Unión Europea es fundamental, así como la necesidad de diplomacia sutil en un mundo cada vez más multipolar. Además, la intersección de política y economía está evidenciada en el debate sobre las sanciones económicas y sus capacidades para dirigir decisiones políticas.
En este contexto, comprender las subtiles de oratoria utilizadas en el discurso político y cómo se interrelaciona con el vocabulario jurídico y el terminología económica es crítico. Por ejemplo, el oratorio sobre medidas fiscales austera les intertwine con el discurso sobre legislación presupuestaria y dilectas sobre inflación controlada. De manera similar, las discusiones sobre modificaciones constitucionales están frecuentemente cargadas de tintes políticas, reflejando problemáticas sociales más amplias y división ideológica.
Esta convergencia de vocabularios jurídico, económico y político presenta un desafío único para sistemas de traducción automatizada, demandiendo no solo lingüística exactitud, pero también profunda comprensión de los subtelos de interacción de estas disciplinas.
</spanish>
<Indonesian>:Era yang dikarakterkan oleh kecepatan globalisasi pembandingan antara negara berlatih, hubungan antara hukum internasional, ekonomi dan politika dinamis menjadi semakin kompleks. Hukuman-hukuman yang sebelumnya terbatas dalam batas nasional saat ini menyajikan hingga kontinen, memerlukan pengecahahan yang diperluaskan tentang peraturan dan persuatan internasional. Pusat usaha multi nasional navigasi kasih meandrean pasar global, teori ekonomi yang berdasarkannya untuk mata angka, imbalance dagangan, dan polisi fiskal lebih penting akhirnya. Tentang ekonomi ini senter ke konsep keadaan rata-rata pasar, diwakilkan oleh berbagai faktor termasuk gerakan pelaku, regulasi negara dan krisis global.
Hidup politik, landskap juga penuh meanderean. Perubahan ideologi dan resurekta Nasionalisme adalah peningkatan hubungan diplomatik, dimana perjanji antar negara dan aliansi internasional di ujuk oleh tegakan geopolitik. Mediasi konflik ini oleh entitas supra nasional seperti PBB dan EUB yang melakukanya penting besar, sama sekali diperlukan kekerjaan kerjasama diplomatika dalam dunia yang semakin polarisasi. Selain itu, masalah politik dan ekonomi disajikan dalam debat mengenai ekonomsan dan kesaktinan ekonomsan dalam menghantarkan keputusan politik.
Dalam context ini, memahami subtilitas bahasa yang digunakan dalam diskursi politik, dan bagaimana ia weave dengan jurileg dan bahasa ekonomi, sangat penting. Misalnya, bahasa yang digunakan kerasa yang bersifat budgetari kerap weave dengan bahasa legalkritik budget dan ekonomi dalam mencoba memelihar konsensus inflasi. Sama sekala, percakapan amandemen constitutions sering diberimbau dengan temuan politis, mereflecting kesulitan umum dan ideologi pemisahan.
Konvergensi bahasa hukum, ekonomi, dan politik membuat sistem mesin translater paling unik, membutuhkan tidak hanya lingkungan lingual baik tetapi penuh pemahaman nuansa interaksi antara kedua-dua ilmu ini.
</Indonesian>
🔧 技術詳細
原READMEに技術的な詳細説明が十分に記載されていないため、このセクションは省略されます。
📄 ライセンス
このプロジェクトはApache-2.0ライセンスの下でライセンスされています。
⚠️ 重要提示
短文や、非常に長い文章では、stoptokenの不安定化、重複翻訳が発生することがあります。4000トークン以上の文章を翻訳する場合、読み飛ばし等の性能低下が目立ちます。また、モデルが理解できない概念ではハルシネーションが出現しやすくなります。アウトプットの利用は自己責任でお願いします。
💡 使用建议
長文の場合、Textstreamerの使用をお勧めします。
M2m100 418M
MIT
M2M100は100言語に対応した9900の翻訳方向をサポートする多言語エンコーダーデコーダーモデルです
機械翻訳 複数言語対応
M
facebook
1.6M
299
Opus Mt Fr En
Apache-2.0
Transformerベースのフランス語から英語への神経機械翻訳モデルで、Helsinki-NLPチームによって開発され、OPUS多言語データセットを用いて訓練されました。
機械翻訳 複数言語対応
O
Helsinki-NLP
1.2M
44
Opus Mt Ar En
Apache-2.0
OPUSデータを基に訓練された、transformer-alignアーキテクチャを採用したアラビア語から英語への機械翻訳モデル
機械翻訳 複数言語対応
O
Helsinki-NLP
579.41k
42
M2m100 1.2B
MIT
M2M100は100言語をサポートする多言語機械翻訳モデルで、9900の翻訳方向間で直接翻訳できます。
機械翻訳 複数言語対応
M
facebook
501.82k
167
Indictrans2 Indic En 1B
MIT
25のインド言語と英語の相互翻訳をサポートする1.1Bパラメータ規模の機械翻訳モデル、AI4Bharatプロジェクトによって開発
機械翻訳
Transformers 複数言語対応

I
ai4bharat
473.63k
14
Opus Mt En Zh
Apache-2.0
Transformerアーキテクチャに基づく英語 - 中国語多方言翻訳モデルで、英語から13種類の中国語バリエーションへの翻訳タスクをサポートします。
機械翻訳 複数言語対応
O
Helsinki-NLP
442.08k
367
Opus Mt Zh En
ヘルシンキ大学によって開発された、OPUSコーパスに基づく中国語から英語への機械翻訳モデル
機械翻訳 複数言語対応
O
Helsinki-NLP
441.24k
505
Mbart Large 50 Many To Many Mmt
mBART-large-50をファインチューニングした多言語機械翻訳モデルで、50言語間の相互翻訳をサポート
機械翻訳 複数言語対応
M
facebook
404.66k
357
Opus Mt De En
Apache-2.0
opus-mt-de-enは、transformer-alignアーキテクチャに基づくドイツ語から英語への機械翻訳モデルで、Helsinki-NLPチームによって開発されました。
機械翻訳 複数言語対応
O
Helsinki-NLP
404.33k
44
Opus Mt Es En
Apache-2.0
これはTransformerアーキテクチャに基づくスペイン語から英語への機械翻訳モデルで、Helsinki - NLPチームによって開発されました。
機械翻訳
Transformers 複数言語対応

O
Helsinki-NLP
385.40k
71
おすすめAIモデル
Llama 3 Typhoon V1.5x 8b Instruct
タイ語専用に設計された80億パラメータの命令モデルで、GPT-3.5-turboに匹敵する性能を持ち、アプリケーションシナリオ、検索拡張生成、制限付き生成、推論タスクを最適化
大規模言語モデル
Transformers 複数言語対応

L
scb10x
3,269
16
Cadet Tiny
Openrail
Cadet-TinyはSODAデータセットでトレーニングされた超小型対話モデルで、エッジデバイス推論向けに設計されており、体積はCosmo-3Bモデルの約2%です。
対話システム
Transformers 英語

C
ToddGoldfarb
2,691
6
Roberta Base Chinese Extractive Qa
RoBERTaアーキテクチャに基づく中国語抽出型QAモデルで、与えられたテキストから回答を抽出するタスクに適しています。
質問応答システム 中国語
R
uer
2,694
98