Hoofdstuk 9. Te vertalen bestanden

1. Bestandsformaten
1.1. Platte-tekst bestanden
1.2. Opgemaakte tekstbestanden
2. Andere bestandsformaten
3. Van rechts naar links talen
3.1. LTR- en RTL-tekenreeksen in segmenten mixen
3.2. OmegaT-tags in RTL-segmenten
3.3. Vertaalde RTL-documenten maken

1. Bestandsformaten

U kunt OmegaT gebruiken om bestanden te vertalen in een aantal bestandsformaten. Er zijn twee basale typen bestandsformaten, platte tekst en opgemaakte tekst.

1.1. Platte-tekst bestanden

Platte tekst-bestanden bevatten alleen maar tekst, zodat hun vertaling zo eenvoudig is als het typen van die vertaling. Er zijn meerdere methoden om de codering van een bestand te specificeren zodat de inhoud niet door elkaar wordt gegooid bij het openen in OmegaT. Zulke bestanden hebben geen informatie over opmaak naast de "witte ruimte" die wordt gebruikt om tekst uit te lijnen, alinea's aan te geven of pagina-einden in te voegen. Zij zijn niet in staat informatie te bevatten / te behouden met betrekking tot de kleur, lettertype etc. van de tekst. Momenteel ondersteunt OmegaT de volgende platte tekst-formaten:

  • ASCII tekst (.txt, etc.)

  • Gecodeerde tekst (*.UTF8)

  • Java bronbundels (*.properties)

  • PO-bestanden (*.po)

  • INI (sleutel=waarde) bestanden (*.ini)

  • DTD-bestanden (*.DTD)

  • DokuWiki-bestanden (*.txt)

  • SubRip titelbestanden (*.srt)

  • Magento CE Locale CSV-bestanden (*.csv)

Andere platte-tekst bestanden kunnen worden behandeld door OmegaT door hun bestandstype te koppelen aan een ondersteund bestandstype (bijvoorbeeld .pod-bestanden zouden kunnen worden gekoppeld aan het ASCII tekstfilter) en ze voor te bewerken met specifieke segmentatieregels.

PO-bestanden mogen zowel bron- als doeltekst bevatten. Vanuit dit oogpunt zijn zij platte tekstbestanden plus vertaalgeheugens. Indien voor een opgegeven bronsegment nog geen bestaande vertaling in het vertaalgeheugen van het project (project_save.tmx) aanwezig is, zal de huidige vertaling in project_save.tmx worden opgeslagen als de standaard vertaling. In het geval dat hetzelfde bronsegment echter al bestaat, maar met een andere vertaling, wordt de nieuwe vertaling opgeslagen als een alternatief.

1.2. Opgemaakte tekstbestanden

Opgemaakte tekstbestanden bevatten zowel tekst als informatie, zoals lettertype, afmeting, kleur etc. Zij worden normaal gesproken gemaakt met tekst- of HTML-verwerkingsprogramma's. Zulke bestanden zijn ontworpen om hun informatie over de opmaak te behouden. Zulke informatie over de opmaak kan eenvoudig zijn zoals "dit is vet" of zo complex als tabelgegevens met verschillende lettertype-afmetingen, kleuren, posities etc. In de meeste vertalingen wordt het belangrijk geacht dat het vertaalde document er uitziet zoals het origineel. OmegaT stelt u in staat om dit te doen door het markeren van de tekens/woorden die een speciale opmaak hebben met eenvoudig te bewerken tags. Vereenvoudigen van de opmaak van de originele tekst draagt enorm bij aan het verminderen van het aantal tags. Indien mogelijk zou het gelijk maken van gebruikte lettertypen, lettertype-afmetingen, kleuren etc. het vertalen vereenvoudigen en het aantal mogelijke fouten in tags verminderen. Elk bestandstype wordt verschillend behandeld in OmegaT. Specifiek gedrag kan worden ingesteld in de bestandsfilters. Momenteel ondersteunt OmegaT de volgende opgemaakte tekst-formaten:

  • ODF - OASIS Open Document Format (*.ods, *.ots, *.odt, *.ott, *.odp, *.otp)

  • Microsoft Office Open XML (*.docx, *.dotx, *.xlsx, *.xltx, *.pptx)

  • (X)HTML (*.html, *.xhtml,*.xht)

  • HTML Help Compiler (*.hhc, *.hhk)

  • DocBook (*.xml)

  • XLIFF (*.xlf, *.xliff, *.sdlxliff) - van de variëteit bron=doel

  • QuarkXPress CopyFlowGold (*.tag, *.xtg)

  • ResX-bestanden (*.resx)

  • Android-bronbestanden (*.xml)

  • LaTex (*.tex, *.latex)

  • Help- (*.xml) en Manual- (*.hmxp) bestanden

  • Typo3 LocManager (*.xml)

  • WiX Localization (*.wxl)

  • Iceni Infix (*.xml)

  • Flash XML exporteren (*.xml)

  • Wordfast TXML (*.txml)

  • Camtasia voor Windows (*.camproj)

  • Visio (*.vxd)

Andere opgemaakte tekst-bestanden kunnen worden afgehandeld door OmegaT door hun bestandstype te koppelen aan een ondersteund bestandstype, er van uitgaande dat de overeenkomende segmentatieregels ze juist zullen segmenteren.

2. Andere bestandsformaten

Andere platte tekst- of opgemaakte tekst-bestandsformaten die mogelijk door OmegaT kunnen worden verwerkt zouden ook kunnen bestaan.

Externe programma's kunnen worden gebruikt om bestanden te converteren naar ondersteunde formaten. De vertaalde bestanden moeten daarna weer terug worden geconverteerd naar het originele formaat. Als u bijvoorbeeld een verouderde versie van Microsoft Word hebt, die niet het ODT-formaat kan afhandelen, is hier een manier voor Word-bestanden met de extensie DOC:

  • importeer het bestand in Writer

  • sla het bestand op in de indeling ODT

  • vertaal het in het doel-ODT-bestand

  • laad het doelbestand in Writer

  • sla het bestand op als een DOC-bestand

De kwaliteit van het vertaalde bestand zal afhankelijk zijn van de kwaliteit van het heen-en-weer converteren. Voor het uitvoeren van dergelijke conversies: zorg er voor dat alle opties zijn uitgeprobeerd. Controleer de thuispagina van OmegaT voor een bijgewerkte lijst van hulpprogramma's voor vertalingen.

3. Van rechts naar links talen

Uitvulling van de bron- en doelsegmenten is afhankelijk van de projecttalen. Ze worden standaard links uitgevuld voor talen van Left-To-Right (LTR) en rechts uitgevuld voor talen van Right-To-Left (RTL). U kunt schakelen tussen de verschillende weergavemodi door in te drukken Shift+Ctrl+O (dit is de letter O en niet de numerieke 0). De schakeling met Shift+Ctrl+O heeft drie statussen:

  • standaard uitvulling, die wordt gedefinieerd door de taal

  • links uitvullen

  • rechts uitvullen

Gebruiken van de modus RTL in OmegaT heeft geen enkele invloed op de modus weergeven van de vertaalde documenten die werden gemaakt in OmegaT. De modus weergeven van de vertaalde documenten zal moeten worden aangepast binnen de gewoonlijk gebruikte toepassing (zoals Microsoft Word) om ze weer te geven of te wijzigen (bekijk de relevante handleidingen voor de details). Gebruiken van Shift+Ctrl+O zorgt er voor dat zowel de tekstinvoer als de weergave in OmegaT worden gewijzigd. Door te klikken op het venster en te schakelen met de weergavemodus kan het afzonderlijk worden gebruikt voor alle drie vensters (Bewerken, Overeenkomsten en Woordenlijst). Het kan ook worden gebruikt in alle aanwezige invoervelden in OmegaT - in het zoekvenster, voor de segmentatieregels etc.

Opmerking voor Mac OS X-gebruikers: gebruik de sneltoets Shift+Ctrl+O en niet cmd+Ctrl+O.

3.1. LTR- en RTL-tekenreeksen in segmenten mixen

Bij het schrijven van pure RTL-tekst, kan de standaard (LTR) weergave worden gebruikt. In veel gevallen is het echter noodzakelijk om LTR-tekst in RTL-tekst in te bedden. Bijvoorbeeld in OmegaT-tags, productnamen die moeten worden behouden in de LTR-brontaal, tijdelijke plaatsaanduidingen in lokalisatie-bestanden en getallen in tekst. In dit soort gevallen is het noodzakelijk om te schakelen naar de modus RTL, zodat de RTL- (in feite twee richtingen) tekst correct wordt weergegeven. Waarbij dient te worden opgemerkt dat als OmegaT in de modus RTL staat, zowel de bron als het doel worden weergegeven in de modus RTL. Dit betekent dat als de brontaal in LTR is en de doeltaal is RTL, of vice versa, het nodig zou kunnen zijn om heen en weer te schakelen tussen de modi RTL en LTR om de bron te bekijken en eenvoudiger het doel in te voeren in hun respectievelijke modus.

3.2. OmegaT-tags in RTL-segmenten

Zoals hierboven vermeld zijn OmegaT-tags LTR-tekenreeksen. Bij het vertalen tussen RTL- en LTR-talen kan het nodig zijn dat de vertaler, om de tags juist te lezen uit de bron en om ze dan juist in te voeren in het doel, vele malen moet schakelen tussen de modi LTR en RTL.

Indien het document het toelaat wordt het de vertaler sterk aangeraden om informatie over de opmaak uit het originele document te verwijderen zodat er zo weinig mogelijk tags als nodig is in de OmegaT-interface verschijnen. Volg de aanwijzingen die worden gegeven in Hints voor tagbeheer. Valideer de tags regelmatig (zie Tag-validatie) en maak met regelmatige tussenpozen vertaalde documenten (zie hieronder en Menu) om het eenvoudiger te maken om problemen te zien die opkomen. Een hint: vertalen van een 'platte tekst'-versie van de tekst en het op een later moment toevoegen van het noodzakelijke opmaakprofiel in de relevante toepassing zou misschien minder problematisch blijken te zijn.

3.3. Vertaalde RTL-documenten maken

Als het vertaalde document wordt gemaakt zal de weergaverichting hetzelfde zijn als die van het originele document. Als het originele document LTR was, moet de weergaverichting van het doeldocument handmatig worden gewijzigd naar RTL in de toepassing waarin het wordt weergegeven. Elke indeling voor de uitvoer heeft specifieke manieren om om te gaan met RTL-weergave, controleer de relevante handleidingen voor de toepassing voor details.

Voor .docx-bestanden worden een aantal wijzigingen automatisch gedaan:

  • Alinea's, secties en tabellen wordne ingesteld op bidi
  • Runs (tekstelementen) worden ingesteld op RTL

Het is soms mogelijk om de parameters voor weergave voor het bronbestand te wijzigen zodat dergelijke parameters worden geërfd door de doelbestanden, om te vermijden dat de parameters voor weergave voor de doelbestanden elke keer moeten worden gewijzigd als de bestanden worden geopend. Zulke wijzigingen zijn mogelijk in ODF-bestanden bijvoorbeeld.