Zum Hauptinhalt springen

Unterstützte Sprachen

rosetta wird mit Sprachkarten (Language Cards) ausgeliefert — strukturierten Referenzdateien für mehr als 42 Sprachen. Jede Karte enthält Register-Voreinstellungen, Metadaten zum Höflichkeitssystem, Indikatoren zur Methodenunterstützung und Informationen zur Schrift. Jede Sprache, die Ihr LLM beherrscht, kann mit einer einzigen Konfigurationszeile hinzugefügt werden — die hier aufgeführten verfügen über kuratierte, produktionsreife Register.


Übersetzungsmethoden

Für jede Sprache können Sie eine oder mehrere dieser Übersetzungsmethoden verwenden:

SymbolMethodeFunktionsweiseKosten
🟢Google TranslateNeuronale MT-Basis. Über 130 Sprachen. Nur Schlüssel-Wert-Zeichenfolgen (Key-Value) — kann Markdown-Inhalte nicht sicher übersetzen.~$20/1 Mio. Zeichen
🔵LLM (OpenRouter)Jede Sprache, die das Modell beherrscht. Registergesteuerte Prompts. Verarbeitet Schlüssel-Wert-Paare und Markdown-Inhalte.Variiert je nach Modell
🟣LLM-CoachedLLM + Grammatikwörterbücher + Coaching-Daten, die in Prompts injiziert werden. Am besten für morphologisch komplexe Sprachen geeignet.Variiert je nach Modell
🟠API (Plugin)Von der Community gehostete Übersetzungspipelines, die über HTTP bereitgestellt werden. OCAP-kompatibel.Variiert je nach Anbieter

Setzen Sie GOOGLE_TRANSLATE_API_KEY für Google Translate oder OPENROUTER_API_KEY für LLM-Methoden. Weitere Einzelheiten finden Sie unter Übersetzungsmethoden.


Priorisierte Sprachen

Dies sind die am häufigsten nachgefragten Gebietsschemas (Locales) für Web- und Mobilanwendungen, aufgelistet in der von rosetta empfohlenen, auf Barrierefreiheit ausgerichteten Reihenfolge.

FlaggeSpracheCodeGoogleLLMCoachedSchriftAnmerkungen
🇸🇦ArabischarRTL. Modernes Standardarabisch (فصحى).
🇵🇭Filipino (Taglish)tlCode-Switching: Tagalog primär, Fachbegriffe auf Englisch.
🇫🇷FranzösischfrVous-Form. Geschlechterinklusiv (Connecté·e).
🇪🇸SpanischesNeutrales Lateinamerikanisch.
🇩🇪DeutschdeSie-Form. Geschlechterinklusiv (Benutzer:innen).
🇯🇵Japanischjaです/ます für Fließtext, する für UI-Beschriftungen.
🇨🇳Chinesisch (Vereinfacht)zh简体中文.
🇮🇹ItalienischitLei-Form.
🇧🇷Portugiesisch (BR)ptBrasilianisches Portugiesisch.
🇰🇷KoreanischkoHöfliches Register (해요체).

Wichtige Weltsprachen

FlaggeSpracheCodeGoogleLLMCoachedSchriftAnmerkungen
🇧🇩BengalischbnPräferenz für শুদ্ধ ভাষা.
🇧🇬Bulgarischbg
🇨🇿TschechischcsVykání (Vy-Form).
🇩🇰Dänischda
🇬🇷GriechischelModerne Δημοτική.
🇮🇷PersischfaRTL.
🇫🇮FinnischfiKein grammatikalisches Geschlecht.
🇮🇱HebräischheRTL.
🇮🇳Hindihiशुद्ध हिन्दी. Minimale englische Lehnwörter.
🇭🇺UngarischhuÖn-Form.
🇮🇩Indonesischid
🇲🇾Malaiischms
🇳🇱NiederländischnlU-Form.
🇳🇴NorwegischnbBokmål.
🇵🇱PolnischplPan/Pani-Form.
🇵🇹Portugiesisch (EU)pt-PTEuropäisches Portugiesisch.
🇷🇴Rumänischro
🇷🇺RussischruВы-Form.
🇸🇰SlowakischskVykanie (Vy-Form).
🇷🇸Serbischsr🔤 Lateinisch→KyrillischDeterministischer Schriftkonverter.
🇸🇪Schwedischsv
🇰🇪Swahilisw
🇹🇭ThaithHöflichkeitspartikel ครับ/ค่ะ.
🇹🇷TürkischtrSiz-Form.
🇺🇦UkrainischukВи-Form.
🇵🇰UrduurRTL. آپ-Form.
🇻🇳Vietnamesischvi
🇹🇼Chinesisch (Traditionell)zh-TW繁體中文.

Regionale Varianten

FlaggeSpracheCodeGoogleLLMCoachedSchriftAnmerkungen
🇲🇽Mexikanisches Spanisches-MXTú-Form. Herzliches Register.
🇨🇦Kanadisches Französischfr-CAQuébécois-Redewendungen.

Indigene & ressourcenarme Sprachen

Diese Sprachen werden von kommerziellen MT-Diensten (maschinelle Übersetzung) nicht unterstützt. rosetta stellt die Werkzeuge bereit, damit Sprachgemeinschaften ihre eigenen Methoden nach den OCAP-Prinzipien entwickeln können.

SpracheCodeGoogleLLMCoachedSchriftStatus
🪶Plains Creecrk🔤 SRO→Silbenschrift🚧 In Entwicklung

:::info Plains Cree befindet sich in aktiver Entwicklung Das Register, die Coaching-Infrastruktur, der Schriftkonverter und die Evaluierungsumgebung für Plains Cree sind alle funktionsfähig, aber die Übersetzungspipeline wurde noch nicht veröffentlicht. Wir arbeiten mit Sprachgemeinschaften nach den OCAP-Prinzipien zusammen, um die Qualität vor der Veröffentlichung sicherzustellen. Lesen Sie Eine ressourcenarme Sprache unterstützen für die vollständigen Hintergründe — und wie Sie dazu beitragen können. :::

:::tip Weitere ressourcenarme Sprachen hinzufügen Das Methoden-Plugin-System von rosetta ist genau dafür konzipiert. Eine Sprachgemeinschaft kann eine benutzerdefinierte Übersetzungsmethode entwickeln, sie unter eigener Kontrolle hosten und über die API-Methode bereitstellen. Die Methoden-Rangliste erfasst die Punktzahlen für jedes Sprachpaar — entwickeln Sie eine Methode, führen Sie die Evaluierungsumgebung aus und sichern Sie sich die höchste Punktzahl. :::


Konstruierte Sprachen (Conlangs)

Conlangs werden über LLM-Register und optionale Schriftkonverter unterstützt. Sie nutzen dieselbe Infrastruktur wie natürliche Sprachen — das Quality Gate, das Coaching-System und die Schriftkonvertierungspipeline funktionieren identisch.

SpracheCodeGoogleLLMSchriftAnmerkungen
🖖Klingonischtlh🔤 Romanisierung→pIqaDPUA-Schriftart erforderlich. Vokabular nach Marc Okrand.
🧝Sindarin (Tolkiens Elbisch)x-elvish-s🔤 Lateinisch→TengwarCSUR-PUA-Schriftart erforderlich.
🏴‍☠️Piraten-Englischx-pirateNur Register. Nautische Metaphern.
🦸Kryptonischx-kryptonian🔤 Lateinisch→KryptonischPUA-Schriftart erforderlich.
🎭Shakespeare-Englischx-shakespeareNur Register. Thee/thou, -eth/-est-Formen.
🐸Yoda-Sprachex-yodaNur Register. OSV-Wortstellung.

Weitere Informationen zu den Anforderungen an PUA-Schriftarten, Unicode-Einschränkungen und zum Hinzufügen eigener Sprachen finden Sie unter Conlangs, Schriften & Orthographie.


Sprachvoreinstellungen

Der Assistent init unterstützt Voreinstellungsnamen für eine schnelle Einrichtung. Sie können Voreinstellungen mit individuellen Codes mischen.

VoreinstellungErweitert zu
europeanfr, de, es, it, pt, nl
asianja, zh, ko
globalfr, es, de, ja, zh, ko, pt, ar
nordicda, fi, nb, sv
# Mix presets with individual codes
i18n-rosetta init
# → Target languages: european, ja
# → Resolves to: fr, de, es, it, pt, nl, ja

Beliebige Sprachen hinzufügen

rosetta kann in jede Sprache übersetzen, die Ihr LLM beherrscht — die obige Tabelle listet lediglich Sprachen mit integrierten Register-Voreinstellungen auf. Um eine nicht aufgeführte Sprache hinzuzufügen, fügen Sie deren BCP-47-Code in Ihre Konfiguration ein:

{
"languages": {
"sw": {},
"am": {
"register": "Formal Amharic. Professional register with Geʽez script."
}
}
}

Das LLM übersetzt unter Verwendung seines Trainingswissens über die Sprache. Durch das Festlegen eines register erhalten Sie die Kontrolle über Tonfall, Höflichkeitsform und orthographische Konventionen. Weitere Einzelheiten finden Sie unter Konfiguration.


Sprachkarten

Jede integrierte Sprache verfügt über eine Sprachkarte (Language Card) — eine JSON-Datei in lib/data/language-cards/, die Folgendes enthält:

FeldInhalt
HöflichkeitssystemT-V-Distinktion, Sprachebenen, Keigo, Partikel usw.
Register-VoreinstellungenBenannte Voreinstellungen, die spezifisch für den Charakter der Sprache sind
MethodenunterstützungWelche Übersetzungs-APIs diese Sprache unterstützen
Leitfaden zum GeschlechtGrammatikalische Geschlechterregeln und Tipps zum inklusiven Schreiben
Schrift/RichtungISO-15924-Schriftcode und RTL/LTR
EvaluierungsdatensätzeWelche Benchmarks diese Sprache abdecken

Verwendung von Voreinstellungsschlüsseln

Anstatt den vollständigen Registertext zu schreiben, können Sie den Namen eines Voreinstellungsschlüssels verwenden:

{
"languages": {
"fr": "casual-tu",
"ko": "formal-hapsyo",
"ja": "polite"
}
}

Rosetta löst den Schlüssel in den vollständigen Register-Prompt auf. Führen Sie npx i18n-rosetta init aus, um die verfügbaren Voreinstellungen für jede Sprache anzuzeigen.

Beispiel-Voreinstellungen

SpracheVoreinstellungenStandard
Französischformal-vous, casual-tuformal-vous
Koreanischpolite-haeyo, formal-hapsyo, casual-haepolite-haeyo
Japanischpolite, formal-keigo, casualpolite
Deutschformal-Sie, casual-duformal-Sie
Thaineutral-professional, polite-male, polite-femaleneutral-professional
Spanischneutral-professional, formal-usted, casual-tuteoneutral-professional

Unter Eine Sprachkarte beisteuern erfahren Sie, wie Sie Voreinstellungen hinzufügen oder verbessern können.


Siehe auch