Tutorial: Een Translation Plugin bouwen

Bouw een aangepaste vertaalmethode vanaf nul op, benchmark deze en implementeer deze als een rosetta-plugin. Dit is de volledige workflow voor het toevoegen van een nieuw talenpaar dat door geen enkele kant-en-klare API wordt ondersteund.

Wat u gaat bouwen: Een gecoachte Translation Plugin voor formeel Frans met afgedwongen terminologie, grammaticaregels en benchmarkscores.

Tijd: 30–45 minuten

Vereisten:

i18n-rosetta geïnstalleerd (npm install --save-dev i18n-rosetta)
Een OpenRouter API-sleutel (OPENROUTER_API_KEY)
Python 3.10+ (voor de eval harness)

Stap 1: Identificeer het probleem

U vertaalt een SaaS-dashboard naar het Frans. De standaard llm-methode levert correcte, maar inconsistente vertalingen op:

Soms wordt "dashboard" vertaald als "tableau de bord", andere keren als "panneau de contrôle"
De toon wisselt tussen de tu en vous vormen
Technische termen worden op inconsistente wijze verengelst

U heeft terminologiehandhaving en registercontrole nodig die de generieke LLM-prompt niet biedt.

Stap 2: Creëer coaching data

Maak een coachingbestand aan dat uw taalkundige vereisten codeert:

mkdir -p .rosetta/coaching

.rosetta/coaching/fr.json
{
  "grammar_rules": [
    "Always use the 'vous' form for formal register",
    "French adjectives agree in gender and number with their noun",
    "Use the present tense for UI instructions, not the imperative",
    "Preserve sentence-final punctuation style from the source"
  ],
  "dictionary": {
    "dashboard": "tableau de bord",
    "deployment": "déploiement",
    "settings": "paramètres",
    "environment variable": "variable d'environnement",
    "webhook": "webhook",
    "API key": "clé API",
    "sign in": "se connecter",
    "sign out": "se déconnecter",
    "repository": "dépôt",
    "pull request": "demande de tirage"
  },
  "style_notes": "Formal technical French. Prefer native French terms over anglicisms where established equivalents exist. Keep UI labels concise — 3 words maximum where possible."
}

Wat elk veld doet:

grammar_rules — Geïnjecteerd in de LLM-systeemprompt als expliciete beperkingen
dictionary — Afgestemd op bronsleutels; wanneer een woordenboekterm verschijnt, wordt deze als "vereiste terminologie" in de prompt geïnjecteerd
style_notes — Toegevoegd aan de systeemprompt als algemene stijlgids

Stap 3: Configureer het paar

Geef rosetta de opdracht om llm-coached te gebruiken voor het Frans:

i18n-rosetta.config.json
{
  "version": 3,
  "inputLocale": "en",
  "localesDir": "./locales",
  "pairs": {
    "en:fr": {
      "method": "llm-coached",
      "model": "google/gemini-3.5-flash"
    }
  },
  "languages": {
    "fr": {
      "register": "Formal technical French (vous-form)",
      "name": "French"
    }
  }
}

Stap 4: Test het

npx i18n-rosetta sync --dry

Controleer de uitvoer van de dry-run. Controleer of:

✅ Woordenboektermen consistent worden gebruikt ("tableau de bord", niet "panneau de contrôle")
✅ De vous-vorm overal wordt gebruikt
✅ Technische termen overeenkomen met uw woordenboek

Voer vervolgens de daadwerkelijke sync uit:

npx i18n-rosetta sync

Stap 5: Benchmark met de Eval Harness (Optioneel)

Als u kwaliteitsscores wilt — en dat wilt u, want plugins worden geleverd met benchmarkgegevens — gebruik dan de bijbehorende eval harness.

Installeer de Harness

git clone https://github.com/gamedaysuits/gds-mt-eval-harness.git
cd gds-mt-eval-harness
pip install -r requirements.txt

Creëer een referentiecorpus

Maak een bestand aan met bronstrings en bewezen goede vertalingen:

corpus/french-formal.json
[
  {
    "source": "Dashboard",
    "reference": "Tableau de bord"
  },
  {
    "source": "Sign in to your account",
    "reference": "Connectez-vous à votre compte"
  },
  {
    "source": "Your deployment is ready",
    "reference": "Votre déploiement est prêt"
  },
  {
    "source": "Environment variables",
    "reference": "Variables d'environnement"
  }
]

Voer de benchmark uit

python harness.py eval \
  --corpus corpus/french-formal.json \
  --source en \
  --target fr \
  --method llm-coached \
  --model google/gemini-3.5-flash

De harness levert de volgende uitvoer:

chrF++ — Character-level F-score (0–100). Boven de 70 is sterk.
BLEU — N-gram overlap (0–100). Boven de 40 is degelijk voor gecoachte vertalingen.
Exact match rate — Het percentage vertalingen dat exact overeenkomt met de referentie.

Exporteer de Plugin

Zodra u tevreden bent met de scores:

python harness.py export \
  --name french-formal-v1 \
  --output ./french-formal-v1/

Dit creëert:

french-formal-v1/
├── method.json          # Manifest with config + benchmarks
└── coaching/
    └── fr.json          # Your coaching data

Stap 6: Installeer de Plugin in Rosetta

npx i18n-rosetta plugin install ./french-formal-v1/

Dit kopieert de plugin naar .rosetta/methods/french-formal-v1/.

Werk uw configuratie bij om deze te gebruiken:

i18n-rosetta.config.json
{
  "pairs": {
    "en:fr": {
      "methodPlugin": "french-formal-v1"
    }
  }
}

Stap 7: Verifieer

# Check plugin is installed and shows benchmark scores
npx i18n-rosetta status

# Run a sync with the plugin
npx i18n-rosetta sync

# Audit licensing status
npx i18n-rosetta provenance

De status-uitvoer toont:

en → fr
  Method:    french-formal-v1 (llm-coached)
  Model:     google/gemini-3.5-flash
  Quality:   high
  chrF++:    74.2
  BLEU:      46.8
  Exact:     42%

Wat u heeft gebouwd

U heeft nu:

Coaching data — Grammaticaregels en terminologie die consistentie afdwingen
Benchmarkscores — Gekwantificeerde kwaliteit die met de plugin wordt meegeleverd
Een draagbare plugin — method.json + coaching data, installeerbaar op elke machine
Productie-implementatie — Geïntegreerd in uw sync pipeline

Volgende stappen

Plugin-specificatie — Volledige referentie van het manifestformaat
Vertaalmethoden — Vergelijk alle vier de methoden
Low-Resource Talen — Pas dit patroon toe op talen zonder API-dekking
Vertaal 30 Talen — Schaal uw project voor een wereldwijd publiek

Stap 1: Identificeer het probleem​

Stap 2: Creëer coaching data​

Stap 3: Configureer het paar​

Stap 4: Test het​

Stap 5: Benchmark met de Eval Harness (Optioneel)​

Installeer de Harness​

Creëer een referentiecorpus​

Voer de benchmark uit​

Exporteer de Plugin​

Stap 6: Installeer de Plugin in Rosetta​

Stap 7: Verifieer​

Wat u heeft gebouwd​

Volgende stappen​