Woordenlijsten zijn bestanden die handmatig gemaakt en bijgewerkt worden voor gebruik in OmegaT.
Als een project in OmegaT één of meer woordenlijsten bevat, worden termen uit de woordenlijst die ook worden gevonden in het huidige segment automatisch weergegeven in het venster Woordenlijst.
U definieert de locatie ervan in het dialoogvenster Projecteigenschappen. De extensie moet .txt
zijn (indien niet zal die worden toegevoegd). De locatie van het bestand moet liggen binnen de map /glossary
, maar het mag in een diepere map staan (bijv. glossary/sub/glossary.txt
). Het bestand hoeft niet te bestaan als het wordt ingesteld, het zal worden gemaakt (indien nodig) bij het toevoegen van
een item voor de woordenlijst. Als het bestand al bestaat, wordt er geen poging gedaan om de indeling of de tekenset van het
bestand te verifiëren: de nieuwe items zullen altijd in de indeling tab-gescheiden en UTF-8 zijn. Omdat de bestaande inhoud
niet wordt geraakt, zal schade aan een bestaand bestand beperkt zijn.
Plaats een bestaande woordenlijst eenvoudigweg in de map /glossary
, na het maken van het project, om die te gebruiken. OmegaT detecteert automatisch woordenlijstbestanden in deze map als een project wordt geopend. Termen in het huidige segment die
OmegaT vindt in het/de woordenlijstbestand(en) worden weergegeven in het venster Woordenlijst:
Het woord voor het =-teken is de bronterm en de vertaling is (of zijn) de woorden na =. Het item voor de woordenlijst kan een opmerking toegevoegd hebben. De functie woordenlijst vindt alleen exacte overeenkomsten met het woordenlijst-item (bijv. vindt geen afgeleide vormen etc.). Nieuwe termen kunnen handmatig aan de bestanden voor de woordenlijst worden toegevoegd tijdens het vertalen,bijvoorbeeld in een tekstverwerkingsprogramma. Nieuw toegevoegde termen worden niet herkend vóórdat de wijzigingen in het tekstbestand zijn opgeslagen.
De bronterm behoeft geen item met één woord te zijn, zoals het volgende voorbeeld laat zien:
Het onderstreepte item "pop-upmenu" kan worden gevonden in het venster Woordenlijst als "pojavni menu". Door het te accentueren in het venster Woordenlijst en er dan met rechts op te klikken voegt het in op de cursorpositie in het doelsegment.[1]
Woordenlijstbestanden zijn eenvoudige platte tekst-bestanden die drie-kolommen, tabgescheiden lijsten bevatten met de bron- en doeltermen in respectievelijk de eerste en tweede kolom. De derde kolom kan worden gebruikt voor aanvullende informatie. Er kunnen items zijn waarin de doelkolom ontbreekt, d.i. bevatten slechts de bronterm en de opmerking.
Woordenlijstbestanden kunnen of in de standaard systeemcodering (en aangegeven door de extensie .tab) zijn of in UTF-8 (de extensie .utf8). De codering Unicode (UTF8) wordt om voor de hand liggende redenen geprefereerd. Ook het CSV-formaat wordt ondersteund. Dit formaat is hetzelfde als de tabgescheiden: bronterm, doelterm. Velden met opmerkingen worden gescheiden door een komma ','. Tekenreeksen kunnen worden omsloten door aanhalingstekens ", die het mogelijk maken een komma binnen een tekenreeks te hebben:
"This is a source term, which contains a comma","Dit is een bronterm, die een komma bevat"
In aanvulling op het platte tekst-formaat, wordt TBX-formaat ook ondersteund. TBX - Term Base eXchange - is de open, op XML gebaseerde standaard voor de uitwisseling van gestructureerde terminologische gegevens. TBX is goedgekeurd als een internationale standaard door LISA en ISO. Als u een bestaand systeem hebt voor de afhandeling van terminologie - MultiTerm bijvoorbeeld - is het zeer wel mogelijk dat het de mogelijkheid biedt om gegevens van terminologie in TBX-formaat te exporteren. Microsoft Terminology Collection kan worden gedownload in bijna 100 talen en kan dienen als hoeksteen IT-woordenlijst.
De projectinstellingen maken het mogelijk een naam in te voeren voor een te beschrijven woordenlijstbestand (zie het begin van dit hoofdstuk). Klik met rechts in het venster Woordenlijst of druk op Ctrl+Shift+G om een nieuw item toe te voegen. Een dialoogvenster opent en maakt het u mogelijk de bronterm, doelterm en opmerkingen die u zou kunnen hebben in te voeren:
De inhoud van bestanden met woordenlijsten worden in het geheugen bewaard en geladen als het project wordt geopend of opnieuw geladen. Bijwerken van een woordenlijstbestand is dus vrij eenvoudig: druk op Ctrl+Shift+G en voer de nieuwe term in, de vertaling ervan en opmerkingen die u zou kunnen hebben (zorg er voor dat u op 'tab' drukt tussen de velden) en sla het bestand op. De inhoud van het venster Woordenlijst zal overeenkomstig worden bijgewerkt.
De locatie van het te beschrijven bestand voor de woordenlijst kan worden ingesteld in het dialoogvenster . De te herkennen extensies zijn TXT
en UTF8
.
Opmerking: Natuurlijk zijn er andere manieren en mogelijkheden om een eenvoudig bestand met tabgescheiden items te maken. Er is niets tegen het gebruiken van Notepad++ op Windows of GEdit op Linux of een werkbladprogramma voor dit doel: elk programma dat UTF8 kan afhandelen en witruimte weer kan geven (zodat de vereiste TAB-tekens u niet ontgaan) kan worden gebruikt.
Woordenlijsten die zijn geëxporteerd vanuit Trados Multiterm kunnen zonder verdere aanpassingen worden gebruikt als woordenlijsten
voor OmegaT, vooropgesteld dat zij de bestandsextensie .tab
hebben gekregen en de velden voor bron- en doelterm respectievelijk de eerste twee velden zijn. Indien u exporteert met behulp
van de systeemoptie "Tabgescheiden exporteren", moet u de eerste 5 kolommen verwijderen (Seq. Nr, Date created etc). De nieuwere
versies van MultiTerm ondersteunen het exporteren naar TBX-formaat.
Probleem: Er worden geen items van de woordenlijst weergegeven - mogelijke oorzaken:
Geen bestand met woordenlijst gevonden in de map "glossary".
Het bestand met de woordenlijst is leeg.
De items worden niet gescheiden door een TAB-teken.
Het bestand met de woordenlijst heeft niet de juiste extensie (.tab of .utf8).
Er bestaat geen EXACTE overeenkomst tussen het item in de woordenlijst en de brontekst in uw document - bijvoorbeeld als het item meervoud is.
Het bestand met de woordenlijst heeft niet de juiste codering.
Er staan in het huidige segment geen termen die overeenkomen met enige term in de woordenlijst.
Eén of meer van bovenstaande problemen kan zijn gerepareerd, maar het project werd nog niet herladen.
Probleem: In het venster Woordenlijst worden sommige tekens niet juist weergegeven
...maar dezelfde tekens worden wel goed weergegeven in het venster Bewerken: de extensie en de codering van het bestand komen niet overeen.
[1] Onthoud dat in het bovenstaande geval, dit slechts het halve verhaal (of zelfs nog minder is) is, omdat de doeltaal (Sloveens) verbuigingen gebruikt. Dus het ingevoegde "pojavni meni" in de nominatieve vorm - moet worden gewijzigd naar "pojavnem meniju", d.i. naar de locatief. Dus is het waarschijnlijk sneller om de term direct correct in te typen zonder u bezig te houden met de woordenlijst en de sneltoetsen daarvan.