اللغات المدعومة
يأتي rosetta مزوداً بـ بطاقات اللغات (Language Cards) — وهي ملفات مرجعية مهيكلة لأكثر من 42 لغة. تحتوي كل بطاقة على إعدادات مسبقة للأسلوب، وبيانات وصفية لنظام الرسمية، وعلامات دعم الطرق، ومعلومات نظام الكتابة. يمكن إضافة أي لغة يعرفها نموذجك اللغوي الكبير (LLM) بسطر إعداد واحد — هذه هي اللغات التي تحتوي على أساليب منسقة وجاهزة للإنتاج.
طرق الترجمة
يمكن لكل لغة استخدام واحدة أو أكثر من طرق الترجمة التالية:
| الأيقونة | الطريقة | كيف تعمل | التكلفة |
|---|---|---|---|
| 🟢 | Google Translate | خط الأساس للترجمة الآلية العصبية (Neural MT). أكثر من 130 لغة. نصوص المفتاح والقيمة (Key-value) فقط — لا يمكنه ترجمة محتوى Markdown بأمان. | ~$20/1M حرف |
| 🔵 | LLM (OpenRouter) | أي لغة يعرفها النموذج. مطالبات موجهة بالأسلوب (Register-steered). يتعامل مع نصوص المفتاح والقيمة + محتوى Markdown. | تختلف حسب النموذج |
| 🟣 | LLM-Coached | LLM + قواميس نحوية + بيانات تدريبية يتم حقنها في المطالبات. الأفضل للغات المعقدة صرفياً. | تختلف حسب النموذج |
| 🟠 | API (Plugin) | مسارات ترجمة مستضافة من قبل المجتمع تُقدم عبر HTTP. متوافقة مع OCAP. | تختلف حسب المزود |
قم بتعيين GOOGLE_TRANSLATE_API_KEY لـ Google Translate، أو OPENROUTER_API_KEY لطرق LLM. راجع طرق الترجمة للحصول على التفاصيل الكاملة.
اللغات ذات الأولوية
هذه هي اللغات الأكثر طلباً لتطبيقات الويب والأجهزة المحمولة، وهي مدرجة بالترتيب الذي يوصي به rosetta مع إعطاء الأولوية لإمكانية الوصول.
| العلم | اللغة | الرمز | LLM | Coached | نظام الكتابة | ملاحظات | |
|---|---|---|---|---|---|---|---|
| 🇸🇦 | العربية | ar | ✅ | ✅ | ✅ | — | من اليمين لليسار (RTL). العربية الفصحى الحديثة. |
| 🇵🇭 | الفلبينية (Taglish) | tl | ✅ | ✅ | ✅ | — | التبديل اللغوي: التاغالوغية أساسية، والمصطلحات التقنية بالإنجليزية. |
| 🇫🇷 | الفرنسية | fr | ✅ | ✅ | ✅ | — | صيغة Vous. شاملة للجنسين (Connecté·e). |
| 🇪🇸 | الإسبانية | es | ✅ | ✅ | ✅ | — | أمريكا اللاتينية المحايدة. |
| 🇩🇪 | الألمانية | de | ✅ | ✅ | ✅ | — | صيغة Sie. شاملة للجنسين (Benutzer:innen). |
| 🇯🇵 | اليابانية | ja | ✅ | ✅ | ✅ | — | です/ます للنص الأساسي، する لتسميات واجهة المستخدم. |
| 🇨🇳 | الصينية (المبسطة) | zh | ✅ | ✅ | ✅ | — | 简体中文. |
| 🇮🇹 | الإيطالية | it | ✅ | ✅ | ✅ | — | صيغة Lei. |
| 🇧🇷 | البرتغالية (البرازيل) | pt | ✅ | ✅ | ✅ | — | البرتغالية البرازيلية. |
| 🇰🇷 | الكورية | ko | ✅ | ✅ | ✅ | — | أسلوب 해요체 المهذب. |
اللغات العالمية الرئيسية
| العلم | اللغة | الرمز | LLM | Coached | نظام الكتابة | ملاحظات | |
|---|---|---|---|---|---|---|---|
| 🇧🇩 | البنغالية | bn | ✅ | ✅ | ✅ | — | تفضيل শুদ্ধ ভাষা. |
| 🇧🇬 | البلغارية | bg | ✅ | ✅ | ✅ | — | |
| 🇨🇿 | التشيكية | cs | ✅ | ✅ | ✅ | — | صيغة Vykání (vy). |
| 🇩🇰 | الدنماركية | da | ✅ | ✅ | ✅ | — | |
| 🇬🇷 | اليونانية | el | ✅ | ✅ | ✅ | — | Δημοτική الحديثة. |
| 🇮🇷 | الفارسية | fa | ✅ | ✅ | ✅ | — | من اليمين لليسار (RTL). |
| 🇫🇮 | الفنلندية | fi | ✅ | ✅ | ✅ | — | لا يوجد جنس نحوي. |
| 🇮🇱 | العبرية | he | ✅ | ✅ | ✅ | — | من اليمين لليسار (RTL). |
| 🇮🇳 | الهندية | hi | ✅ | ✅ | ✅ | — | शुद्ध हिन्दी. الحد الأدنى من الكلمات الدخيلة الإنجليزية. |
| 🇭🇺 | المجرية | hu | ✅ | ✅ | ✅ | — | صيغة Ön. |
| 🇮🇩 | الإندونيسية | id | ✅ | ✅ | ✅ | — | |
| 🇲🇾 | الملايوية | ms | ✅ | ✅ | ✅ | — | |
| 🇳🇱 | الهولندية | nl | ✅ | ✅ | ✅ | — | صيغة U. |
| 🇳🇴 | النرويجية | nb | ✅ | ✅ | ✅ | — | بوكمول (Bokmål). |
| 🇵🇱 | البولندية | pl | ✅ | ✅ | ✅ | — | صيغة Pan/Pani. |
| 🇵🇹 | البرتغالية (أوروبا) | pt-PT | ✅ | ✅ | ✅ | — | البرتغالية الأوروبية. |
| 🇷🇴 | الرومانية | ro | ✅ | ✅ | ✅ | — | |
| 🇷🇺 | الروسية | ru | ✅ | ✅ | ✅ | — | صيغة Вы. |
| 🇸🇰 | السلوفاكية | sk | ✅ | ✅ | ✅ | — | صيغة Vykanie (vy). |
| 🇷🇸 | الصربية | sr | ✅ | ✅ | ✅ | 🔤 لاتيني→سيريلي | محول نظام كتابة حتمي. |
| 🇸🇪 | السويدية | sv | ✅ | ✅ | ✅ | — | |
| 🇰🇪 | السواحلية | sw | ✅ | ✅ | ✅ | — | |
| 🇹🇭 | التايلاندية | th | ✅ | ✅ | ✅ | — | أدوات التهذيب ครับ/ค่ะ. |
| 🇹🇷 | التركية | tr | ✅ | ✅ | ✅ | — | صيغة Siz. |
| 🇺🇦 | الأوكرانية | uk | ✅ | ✅ | ✅ | — | صيغة Ви. |
| 🇵🇰 | الأردية | ur | ✅ | ✅ | ✅ | — | من اليمين لليسار (RTL). صيغة آپ. |
| 🇻🇳 | الفيتنامية | vi | ✅ | ✅ | ✅ | — | |
| 🇹🇼 | الصينية (التقليدية) | zh-TW | ✅ | ✅ | ✅ | — | 繁體中文. |
المتغيرات الإقليمية
| العلم | اللغة | الرمز | LLM | Coached | نظام الكتابة | ملاحظات | |
|---|---|---|---|---|---|---|---|
| 🇲🇽 | الإسبانية المكسيكية | es-MX | ✅ | ✅ | ✅ | — | صيغة Tú. أسلوب دافئ. |
| 🇨🇦 | الفرنسية الكندية | fr-CA | ✅ | ✅ | ✅ | — | مصطلحات كيبيك (Québécois). |
اللغات الأصلية ومحدودة الموارد
هذه اللغات غير مدعومة من قبل خدمات الترجمة الآلية (MT) التجارية. يوفر rosetta الأدوات للمجتمعات اللغوية لبناء طرقهم الخاصة وفقاً لـ مبادئ OCAP.
| اللغة | الرمز | LLM | Coached | نظام الكتابة | الحالة | ||
|---|---|---|---|---|---|---|---|
| 🪶 | لغة الكري للسهول (Plains Cree) | crk | ❌ | ✅ | ✅ | 🔤 SRO→مقاطع | 🚧 قيد التطوير |
:::info لغة الكري للسهول قيد التطوير النشط الأسلوب، والبنية التحتية للتدريب، ومحول نظام الكتابة، وأدوات التقييم للغة الكري للسهول تعمل جميعها، ولكن مسار الترجمة لم يتم إصداره بعد. نحن نعمل مع المجتمعات اللغوية وفقاً لـ مبادئ OCAP لضمان الجودة قبل الإصدار. راجع دعم لغة محدودة الموارد لمعرفة القصة الكاملة — وكيف يمكنك المساهمة. :::
:::tip إضافة المزيد من اللغات محدودة الموارد تم تصميم نظام الإضافات لطرق الترجمة في rosetta لهذا الغرض. يمكن للمجتمع اللغوي بناء طريقة ترجمة مخصصة، واستضافتها تحت سيطرتهم الخاصة، وتقديمها عبر طريقة API. تتتبع لوحة صدارة الطرق (Method Leaderboard) الدرجات لأي زوج لغوي — قم ببناء طريقة، وشغّل أدوات التقييم، واحصل على أعلى درجة. :::
اللغات المصطنعة (Constructed Languages)
يتم دعم اللغات المصطنعة (Conlangs) عبر أساليب LLM ومحولات أنظمة الكتابة الاختيارية. وهي تستخدم نفس البنية التحتية للغات الحقيقية — حيث تعمل بوابة الجودة، ونظام التدريب، ومسار تحويل نظام الكتابة بشكل متطابق.
| اللغة | الرمز | LLM | نظام الكتابة | ملاحظات | ||
|---|---|---|---|---|---|---|
| 🖖 | الكلينغونية (Klingon) | tlh | ❌ | ✅ | 🔤 رومنة→pIqaD | يتطلب خط PUA. مفردات مارك أوكراند. |
| 🧝 | السندارين (لغة تولكين الجنية) | x-elvish-s | ❌ | ✅ | 🔤 لاتيني→Tengwar | يتطلب خط CSUR PUA. |
| 🏴☠️ | إنجليزية القراصنة | x-pirate | ❌ | ✅ | — | أسلوب فقط. استعارات بحرية. |
| 🦸 | الكريبتونية | x-kryptonian | ❌ | ✅ | 🔤 لاتيني→كريبتوني | يتطلب خط PUA. |
| 🎭 | الإنجليزية الشكسبيرية | x-shakespeare | ❌ | ✅ | — | أسلوب فقط. صيغ Thee/thou و -eth/-est. |
| 🐸 | لغة يودا (Yoda-speak) | x-yoda | ❌ | ✅ | — | أسلوب فقط. ترتيب الكلمات OSV. |
راجع اللغات المصطنعة، وأنظمة الكتابة، والإملاء لمعرفة متطلبات خطوط PUA، وقيود Unicode، وكيفية إضافة لغتك الخاصة.
الإعدادات المسبقة للغات
يدعم معالج init أسماء الإعدادات المسبقة للإعداد السريع. يمكنك المزج بين الإعدادات المسبقة والرموز الفردية.
| الإعداد المسبق | يتوسع إلى |
|---|---|
european | fr, de, es, it, pt, nl |
asian | ja, zh, ko |
global | fr, es, de, ja, zh, ko, pt, ar |
nordic | da, fi, nb, sv |
# Mix presets with individual codes
i18n-rosetta init
# → Target languages: european, ja
# → Resolves to: fr, de, es, it, pt, nl, ja
إضافة أي لغة
يمكن لـ rosetta الترجمة إلى أي لغة يعرفها نموذجك اللغوي الكبير (LLM) — الجدول أعلاه يسرد فقط اللغات التي تحتوي على إعدادات مسبقة مدمجة للأسلوب. لإضافة لغة غير مدرجة، قم بتضمين رمز BCP-47 الخاص بها في إعداداتك:
{
"languages": {
"sw": {},
"am": {
"register": "Formal Amharic. Professional register with Geʽez script."
}
}
}
سيقوم LLM بالترجمة باستخدام معرفته التدريبية باللغة. يمنحك تعيين register التحكم في النبرة، والرسمية، والاصطلاحات الإملائية. راجع الإعدادات للحصول على التفاصيل.
بطاقات اللغات
تحتوي كل لغة مدمجة على بطاقة لغة (Language Card) — وهو ملف JSON في lib/data/language-cards/ يحتوي على:
| الحقل | ماذا يحتوي |
|---|---|
| نظام الرسمية (Formality system) | تمييز T-V، ومستويات التحدث، و keigo، والأدوات، إلخ. |
| الإعدادات المسبقة للأسلوب (Register presets) | إعدادات مسبقة مسماة خاصة بطبيعة اللغة |
| دعم الطرق (Method support) | واجهات برمجة تطبيقات (APIs) الترجمة التي تدعم هذه اللغة |
| توجيهات الجنس النحوي (Gender guidance) | قواعد الجنس النحوي ونصائح الكتابة الشاملة |
| نظام الكتابة/الاتجاه (Script/direction) | رمز نظام الكتابة ISO 15924 والاتجاه (RTL/LTR) |
| مجموعات بيانات التقييم (Eval datasets) | المعايير التي تغطي هذه اللغة |
استخدام مفاتيح الإعدادات المسبقة
بدلاً من كتابة نص الأسلوب بالكامل، يمكنك استخدام اسم مفتاح الإعداد المسبق:
{
"languages": {
"fr": "casual-tu",
"ko": "formal-hapsyo",
"ja": "polite"
}
}
يقوم Rosetta بتحليل المفتاح إلى مطالبة الأسلوب الكاملة. قم بتشغيل npx i18n-rosetta init لرؤية الإعدادات المسبقة المتاحة لكل لغة.
أمثلة على الإعدادات المسبقة
| اللغة | الإعدادات المسبقة | الافتراضي |
|---|---|---|
| الفرنسية | formal-vous, casual-tu | formal-vous |
| الكورية | polite-haeyo, formal-hapsyo, casual-hae | polite-haeyo |
| اليابانية | polite, formal-keigo, casual | polite |
| الألمانية | formal-Sie, casual-du | formal-Sie |
| التايلاندية | neutral-professional, polite-male, polite-female | neutral-professional |
| الإسبانية | neutral-professional, formal-usted, casual-tuteo | neutral-professional |
راجع المساهمة ببطاقة لغة لمعرفة كيفية إضافة أو تحسين الإعدادات المسبقة.
انظر أيضاً
- الإعدادات — مرجع الإعدادات الكامل بما في ذلك إعداد اللغة
- طرق الترجمة — كيف تعمل كل طريقة
- محولات أنظمة الكتابة — مسار حتمي لتحويل نظام الكتابة
- اللغات المصطنعة، وأنظمة الكتابة، والإملاء — خطوط PUA، و Unicode، وإضافة اللغات المصطنعة
- دعم لغة محدودة الموارد — بناء طرق للغات غير المخدومة بشكل كافٍ