Mag-skip sa main content

Mga Supported na Language

Ang rosetta ay may kasamang mga Language Card — mga structured reference file para sa 42+ na language. Naglalaman ang bawat card ng mga register preset, formality system metadata, method support flags, at script information. Kahit anong language na alam ng LLM mo ay pwedeng i-add gamit ang isang config line — ito ang mga may curated at production-ready na mga register.


Mga Translation Method

Ang bawat language ay pwedeng gumamit ng isa o higit pa sa mga translation method na ito:

IconMethodPaano Ito GumaganaCost
🟢Google TranslateNeural MT baseline. 130+ languages. Key-value strings lang — hindi kayang i-translate nang safe ang Markdown content.~$20/1M chars
🔵LLM (OpenRouter)Kahit anong language na alam ng model. Register-steered prompts. Kayang i-handle ang key-value + Markdown content.Depende sa model
🟣LLM-CoachedLLM + grammar dictionaries + coaching data na naka-inject sa mga prompt. Best para sa mga morphologically complex na language.Depende sa model
🟠API (Plugin)Community-hosted translation pipelines na naka-serve over HTTP. OCAP-compatible.Depende sa provider

I-set ang GOOGLE_TRANSLATE_API_KEY para sa Google Translate, o OPENROUTER_API_KEY para sa mga LLM method. Tingnan ang Mga Translation Method para sa buong detalye.


Mga Priority Language

Ito ang mga pinakamadalas i-request na locale para sa mga web at mobile application, na naka-list ayon sa recommended accessibility-first order ng rosetta.

FlagLanguageCodeGoogleLLMCoachedScriptNotes
🇸🇦ArabicarRTL. Modern Standard Arabic (فصحى).
🇵🇭Filipino (Taglish)tlCode-switching: Tagalog primary, technical terms in English.
🇫🇷FrenchfrVous-form. Gender-inclusive (Connecté·e).
🇪🇸SpanishesNeutral Latin American.
🇩🇪GermandeSie-form. Gender-inclusive (Benutzer:innen).
🇯🇵Japanesejaです/ます para sa body text, する para sa mga UI label.
🇨🇳Chinese (Simplified)zh简体中文.
🇮🇹ItalianitLei-form.
🇧🇷Portuguese (BR)ptBrazilian Portuguese.
🇰🇷Koreanko해요체 polite register.

Mga Major World Language

FlagLanguageCodeGoogleLLMCoachedScriptNotes
🇧🇩Bengalibnশুদ্ধ ভাষা preference.
🇧🇬Bulgarianbg
🇨🇿CzechcsVykání (vy-form).
🇩🇰Danishda
🇬🇷GreekelModern Δημοτική.
🇮🇷PersianfaRTL.
🇫🇮FinnishfiWalang grammatical gender.
🇮🇱HebrewheRTL.
🇮🇳Hindihiशुद्ध हिन्दी. Minimal na English loanwords.
🇭🇺HungarianhuÖn-form.
🇮🇩Indonesianid
🇲🇾Malayms
🇳🇱DutchnlU-form.
🇳🇴NorwegiannbBokmål.
🇵🇱PolishplPan/Pani form.
🇵🇹Portuguese (EU)pt-PTEuropean Portuguese.
🇷🇴Romanianro
🇷🇺RussianruВы-form.
🇸🇰SlovakskVykanie (vy-form).
🇷🇸Serbiansr🔤 Latin→CyrillicDeterministic script converter.
🇸🇪Swedishsv
🇰🇪Swahilisw
🇹🇭Thaithครับ/ค่ะ politeness particles.
🇹🇷TurkishtrSiz-form.
🇺🇦UkrainianukВи-form.
🇵🇰UrduurRTL. آپ form.
🇻🇳Vietnamesevi
🇹🇼Chinese (Traditional)zh-TW繁體中文.

Mga Regional Variant

FlagLanguageCodeGoogleLLMCoachedScriptNotes
🇲🇽Mexican Spanishes-MXTú-form. Warm register.
🇨🇦Canadian Frenchfr-CAQuébécois idioms.

Mga Indigenous & Low-Resource Language

Hindi supported ang mga language na ito ng mga commercial MT service. Nagpo-provide ang rosetta ng tooling para sa mga language community na i-build ang sarili nilang mga method sa ilalim ng mga OCAP principle.

LanguageCodeGoogleLLMCoachedScriptStatus
🪶Plains Creecrk🔤 SRO→Syllabics🚧 Under development

:::info Ang Plains Cree ay under active development Functional na ang register, coaching infrastructure, script converter, at evaluation harness para sa Plains Cree, pero hindi pa nare-release ang translation pipeline. Nakikipagtulungan po kami sa mga language community sa ilalim ng mga OCAP principle para masiguro ang quality bago ito i-release. Tingnan ang Suportahan ang isang Low-Resource Language para sa buong kwento — at kung paano ka makakapag-contribute. :::

:::tip Pag-add ng mas marami pang low-resource language Naka-design para dito ang method plugin system ng rosetta. Pwedeng mag-build ang isang language community ng custom translation method, i-host ito under their own control, at i-serve via the API method. Tinu-track ng Method Leaderboard ang mga score para sa kahit anong language pair — mag-build ng method, i-run ang harness, at i-claim ang top score. :::


Mga Constructed Language

Supported ang mga conlang via LLM registers at optional script converters. Gumagamit sila ng parehong infrastructure tulad ng mga totoong language — magkapareho ang paggana ng quality gate, coaching system, at script conversion pipeline.

LanguageCodeGoogleLLMScriptNotes
🖖Klingontlh🔤 Romanization→pIqaDKailangan ng PUA font. Marc Okrand vocabulary.
🧝Sindarin (Tolkien Elvish)x-elvish-s🔤 Latin→TengwarKailangan ng CSUR PUA font.
🏴‍☠️Pirate Englishx-pirateRegister only. Mga nautical metaphor.
🦸Kryptonianx-kryptonian🔤 Latin→KryptonianKailangan ng PUA font.
🎭Shakespearean Englishx-shakespeareRegister only. Thee/thou, -eth/-est forms.
🐸Yoda-speakx-yodaRegister only. OSV word order.

Tingnan ang Mga Conlang, Script at Orthography para sa mga PUA font requirement, Unicode limitation, at kung paano mag-add ng sarili mo.


Mga Language Preset

Supported ng init wizard ang mga preset name para sa quick setup. Pwede mong i-mix ang mga preset sa mga individual code.

PresetExpands To
europeanfr, de, es, it, pt, nl
asianja, zh, ko
globalfr, es, de, ja, zh, ko, pt, ar
nordicda, fi, nb, sv
# Mix presets with individual codes
i18n-rosetta init
# → Target languages: european, ja
# → Resolves to: fr, de, es, it, pt, nl, ja

Pag-add ng Kahit Anong Language

Kayang mag-translate ng rosetta sa kahit anong language na alam ng LLM mo — naka-list lang sa table sa itaas ang mga language na may built-in register presets. Para mag-add ng unlisted language, i-include ang BCP-47 code nito sa config mo:

{
"languages": {
"sw": {},
"am": {
"register": "Formal Amharic. Professional register with Geʽez script."
}
}
}

Magta-translate ang LLM gamit ang training knowledge nito sa language. Ang pag-set ng register ay magbibigay sa iyo ng control sa tone, formality, at orthographic conventions. Tingnan ang Configuration para sa mga detalye.


Mga Language Card

Ang bawat built-in na language ay may Language Card — isang JSON file sa lib/data/language-cards/ na naglalaman ng:

FieldAno Ang Laman Nito
Formality systemT-V distinction, speech levels, keigo, particles, atbp.
Register presetsMga named preset na specific sa character ng language
Method supportKung aling mga translation API ang nagsu-support sa language na ito
Gender guidanceMga grammatical gender rule at inclusive writing tips
Script/directionISO 15924 script code at RTL/LTR
Eval datasetsKung aling mga benchmark ang nagco-cover sa language na ito

Paggamit ng mga Preset Key

Sa halip na magsulat ng buong register text, pwede kang gumamit ng preset key name:

{
"languages": {
"fr": "casual-tu",
"ko": "formal-hapsyo",
"ja": "polite"
}
}

Nire-resolve ng Rosetta ang key papunta sa buong register prompt. I-run ang npx i18n-rosetta init para makita ang mga available na preset para sa bawat language.

Mga Example Preset

LanguageMga PresetDefault
Frenchformal-vous, casual-tuformal-vous
Koreanpolite-haeyo, formal-hapsyo, casual-haepolite-haeyo
Japanesepolite, formal-keigo, casualpolite
Germanformal-Sie, casual-duformal-Sie
Thaineutral-professional, polite-male, polite-femaleneutral-professional
Spanishneutral-professional, formal-usted, casual-tuteoneutral-professional

Tingnan ang Pag-contribute ng Language Card para sa kung paano mag-add o mag-improve ng mga preset.


Tingnan Din