تخطي إلى المحتوى الرئيسي

اللغات المدعومة

يأتي rosetta مزوداً بـ بطاقات اللغات (Language Cards) — وهي ملفات مرجعية مهيكلة لأكثر من 42 لغة. تحتوي كل بطاقة على إعدادات مسبقة للأسلوب، وبيانات وصفية لنظام الرسمية، وعلامات دعم الطرق، ومعلومات نظام الكتابة. يمكن إضافة أي لغة يعرفها نموذجك اللغوي الكبير (LLM) بسطر إعداد واحد — هذه هي اللغات التي تحتوي على أساليب منسقة وجاهزة للإنتاج.


طرق الترجمة

يمكن لكل لغة استخدام واحدة أو أكثر من طرق الترجمة التالية:

الأيقونةالطريقةكيف تعملالتكلفة
🟢Google Translateخط الأساس للترجمة الآلية العصبية (Neural MT). أكثر من 130 لغة. نصوص المفتاح والقيمة (Key-value) فقط — لا يمكنه ترجمة محتوى Markdown بأمان.~$20/1M حرف
🔵LLM (OpenRouter)أي لغة يعرفها النموذج. مطالبات موجهة بالأسلوب (Register-steered). يتعامل مع نصوص المفتاح والقيمة + محتوى Markdown.تختلف حسب النموذج
🟣LLM-CoachedLLM + قواميس نحوية + بيانات تدريبية يتم حقنها في المطالبات. الأفضل للغات المعقدة صرفياً.تختلف حسب النموذج
🟠API (Plugin)مسارات ترجمة مستضافة من قبل المجتمع تُقدم عبر HTTP. متوافقة مع OCAP.تختلف حسب المزود

قم بتعيين GOOGLE_TRANSLATE_API_KEY لـ Google Translate، أو OPENROUTER_API_KEY لطرق LLM. راجع طرق الترجمة للحصول على التفاصيل الكاملة.


اللغات ذات الأولوية

هذه هي اللغات الأكثر طلباً لتطبيقات الويب والأجهزة المحمولة، وهي مدرجة بالترتيب الذي يوصي به rosetta مع إعطاء الأولوية لإمكانية الوصول.

العلماللغةالرمزGoogleLLMCoachedنظام الكتابةملاحظات
🇸🇦العربيةarمن اليمين لليسار (RTL). العربية الفصحى الحديثة.
🇵🇭الفلبينية (Taglish)tlالتبديل اللغوي: التاغالوغية أساسية، والمصطلحات التقنية بالإنجليزية.
🇫🇷الفرنسيةfrصيغة Vous. شاملة للجنسين (Connecté·e).
🇪🇸الإسبانيةesأمريكا اللاتينية المحايدة.
🇩🇪الألمانيةdeصيغة Sie. شاملة للجنسين (Benutzer:innen).
🇯🇵اليابانيةjaです/ます للنص الأساسي، する لتسميات واجهة المستخدم.
🇨🇳الصينية (المبسطة)zh简体中文.
🇮🇹الإيطاليةitصيغة Lei.
🇧🇷البرتغالية (البرازيل)ptالبرتغالية البرازيلية.
🇰🇷الكوريةkoأسلوب 해요체 المهذب.

اللغات العالمية الرئيسية

العلماللغةالرمزGoogleLLMCoachedنظام الكتابةملاحظات
🇧🇩البنغاليةbnتفضيل শুদ্ধ ভাষা.
🇧🇬البلغاريةbg
🇨🇿التشيكيةcsصيغة Vykání (vy).
🇩🇰الدنماركيةda
🇬🇷اليونانيةelΔημοτική الحديثة.
🇮🇷الفارسيةfaمن اليمين لليسار (RTL).
🇫🇮الفنلنديةfiلا يوجد جنس نحوي.
🇮🇱العبريةheمن اليمين لليسار (RTL).
🇮🇳الهنديةhiशुद्ध हिन्दी. الحد الأدنى من الكلمات الدخيلة الإنجليزية.
🇭🇺المجريةhuصيغة Ön.
🇮🇩الإندونيسيةid
🇲🇾الملايويةms
🇳🇱الهولنديةnlصيغة U.
🇳🇴النرويجيةnbبوكمول (Bokmål).
🇵🇱البولنديةplصيغة Pan/Pani.
🇵🇹البرتغالية (أوروبا)pt-PTالبرتغالية الأوروبية.
🇷🇴الرومانيةro
🇷🇺الروسيةruصيغة Вы.
🇸🇰السلوفاكيةskصيغة Vykanie (vy).
🇷🇸الصربيةsr🔤 لاتيني→سيريليمحول نظام كتابة حتمي.
🇸🇪السويديةsv
🇰🇪السواحليةsw
🇹🇭التايلانديةthأدوات التهذيب ครับ/ค่ะ.
🇹🇷التركيةtrصيغة Siz.
🇺🇦الأوكرانيةukصيغة Ви.
🇵🇰الأرديةurمن اليمين لليسار (RTL). صيغة آپ.
🇻🇳الفيتناميةvi
🇹🇼الصينية (التقليدية)zh-TW繁體中文.

المتغيرات الإقليمية

العلماللغةالرمزGoogleLLMCoachedنظام الكتابةملاحظات
🇲🇽الإسبانية المكسيكيةes-MXصيغة Tú. أسلوب دافئ.
🇨🇦الفرنسية الكنديةfr-CAمصطلحات كيبيك (Québécois).

اللغات الأصلية ومحدودة الموارد

هذه اللغات غير مدعومة من قبل خدمات الترجمة الآلية (MT) التجارية. يوفر rosetta الأدوات للمجتمعات اللغوية لبناء طرقهم الخاصة وفقاً لـ مبادئ OCAP.

اللغةالرمزGoogleLLMCoachedنظام الكتابةالحالة
🪶لغة الكري للسهول (Plains Cree)crk🔤 SRO→مقاطع🚧 قيد التطوير

:::info لغة الكري للسهول قيد التطوير النشط الأسلوب، والبنية التحتية للتدريب، ومحول نظام الكتابة، وأدوات التقييم للغة الكري للسهول تعمل جميعها، ولكن مسار الترجمة لم يتم إصداره بعد. نحن نعمل مع المجتمعات اللغوية وفقاً لـ مبادئ OCAP لضمان الجودة قبل الإصدار. راجع دعم لغة محدودة الموارد لمعرفة القصة الكاملة — وكيف يمكنك المساهمة. :::

:::tip إضافة المزيد من اللغات محدودة الموارد تم تصميم نظام الإضافات لطرق الترجمة في rosetta لهذا الغرض. يمكن للمجتمع اللغوي بناء طريقة ترجمة مخصصة، واستضافتها تحت سيطرتهم الخاصة، وتقديمها عبر طريقة API. تتتبع لوحة صدارة الطرق (Method Leaderboard) الدرجات لأي زوج لغوي — قم ببناء طريقة، وشغّل أدوات التقييم، واحصل على أعلى درجة. :::


اللغات المصطنعة (Constructed Languages)

يتم دعم اللغات المصطنعة (Conlangs) عبر أساليب LLM ومحولات أنظمة الكتابة الاختيارية. وهي تستخدم نفس البنية التحتية للغات الحقيقية — حيث تعمل بوابة الجودة، ونظام التدريب، ومسار تحويل نظام الكتابة بشكل متطابق.

اللغةالرمزGoogleLLMنظام الكتابةملاحظات
🖖الكلينغونية (Klingon)tlh🔤 رومنة→pIqaDيتطلب خط PUA. مفردات مارك أوكراند.
🧝السندارين (لغة تولكين الجنية)x-elvish-s🔤 لاتيني→Tengwarيتطلب خط CSUR PUA.
🏴‍☠️إنجليزية القراصنةx-pirateأسلوب فقط. استعارات بحرية.
🦸الكريبتونيةx-kryptonian🔤 لاتيني→كريبتونييتطلب خط PUA.
🎭الإنجليزية الشكسبيريةx-shakespeareأسلوب فقط. صيغ Thee/thou و -eth/-est.
🐸لغة يودا (Yoda-speak)x-yodaأسلوب فقط. ترتيب الكلمات OSV.

راجع اللغات المصطنعة، وأنظمة الكتابة، والإملاء لمعرفة متطلبات خطوط PUA، وقيود Unicode، وكيفية إضافة لغتك الخاصة.


الإعدادات المسبقة للغات

يدعم معالج init أسماء الإعدادات المسبقة للإعداد السريع. يمكنك المزج بين الإعدادات المسبقة والرموز الفردية.

الإعداد المسبقيتوسع إلى
europeanfr, de, es, it, pt, nl
asianja, zh, ko
globalfr, es, de, ja, zh, ko, pt, ar
nordicda, fi, nb, sv
# Mix presets with individual codes
i18n-rosetta init
# → Target languages: european, ja
# → Resolves to: fr, de, es, it, pt, nl, ja

إضافة أي لغة

يمكن لـ rosetta الترجمة إلى أي لغة يعرفها نموذجك اللغوي الكبير (LLM) — الجدول أعلاه يسرد فقط اللغات التي تحتوي على إعدادات مسبقة مدمجة للأسلوب. لإضافة لغة غير مدرجة، قم بتضمين رمز BCP-47 الخاص بها في إعداداتك:

{
"languages": {
"sw": {},
"am": {
"register": "Formal Amharic. Professional register with Geʽez script."
}
}
}

سيقوم LLM بالترجمة باستخدام معرفته التدريبية باللغة. يمنحك تعيين register التحكم في النبرة، والرسمية، والاصطلاحات الإملائية. راجع الإعدادات للحصول على التفاصيل.


بطاقات اللغات

تحتوي كل لغة مدمجة على بطاقة لغة (Language Card) — وهو ملف JSON في lib/data/language-cards/ يحتوي على:

الحقلماذا يحتوي
نظام الرسمية (Formality system)تمييز T-V، ومستويات التحدث، و keigo، والأدوات، إلخ.
الإعدادات المسبقة للأسلوب (Register presets)إعدادات مسبقة مسماة خاصة بطبيعة اللغة
دعم الطرق (Method support)واجهات برمجة تطبيقات (APIs) الترجمة التي تدعم هذه اللغة
توجيهات الجنس النحوي (Gender guidance)قواعد الجنس النحوي ونصائح الكتابة الشاملة
نظام الكتابة/الاتجاه (Script/direction)رمز نظام الكتابة ISO 15924 والاتجاه (RTL/LTR)
مجموعات بيانات التقييم (Eval datasets)المعايير التي تغطي هذه اللغة

استخدام مفاتيح الإعدادات المسبقة

بدلاً من كتابة نص الأسلوب بالكامل، يمكنك استخدام اسم مفتاح الإعداد المسبق:

{
"languages": {
"fr": "casual-tu",
"ko": "formal-hapsyo",
"ja": "polite"
}
}

يقوم Rosetta بتحليل المفتاح إلى مطالبة الأسلوب الكاملة. قم بتشغيل npx i18n-rosetta init لرؤية الإعدادات المسبقة المتاحة لكل لغة.

أمثلة على الإعدادات المسبقة

اللغةالإعدادات المسبقةالافتراضي
الفرنسيةformal-vous, casual-tuformal-vous
الكوريةpolite-haeyo, formal-hapsyo, casual-haepolite-haeyo
اليابانيةpolite, formal-keigo, casualpolite
الألمانيةformal-Sie, casual-duformal-Sie
التايلانديةneutral-professional, polite-male, polite-femaleneutral-professional
الإسبانيةneutral-professional, formal-usted, casual-tuteoneutral-professional

راجع المساهمة ببطاقة لغة لمعرفة كيفية إضافة أو تحسين الإعدادات المسبقة.


انظر أيضاً