Egyszerű szöveg fordítása


Alapbeállítás szerinti kódolás

Az egyszerű szöveges állományok legtöbbször .txt kiterjesztésű, kizárólag szöveges információt tartalmaznak. Az egyszerű szöveges állományokban nincs egyértelmű utasítás a számítógép számára arra vonatkozóan, hogy milyen nyelven íródtak. Ez nagyjából azt jelenti, hogy a számítógép abból indul ki, hogy a szöveg nyelve a számítógép alapbeállítása szerinti nyelvvel megegyezik.


Zavaros megjelenítés

Egy orosz felhasználó esetén a számítógép nagy valószínűséggel szintén oroszul működik: a menük oroszul vannak, a megnyíló állományok nyelve is orosz stb. Legtöbbször a számítógép helyes feltételezésből indul ki, mivel a nyelvi környezet minden eleme orosz megjelenítést kíván.

Ha egy orosz fordító japán állományokat kap fordításra egyszerű szöveg formában, ezeket a gép orosznak fogja tekinteni. Ennek az az oka, hogy az állományban nincs utasítás a számítógép részére arról, hogy a szöveg milyen nyelven íródott. A japán állomány tartalma lehet pl. a következő:

OmegaTとは、コンピュータを利用した翻訳ツールです。


Mivel orosz tartalmat feltételez, ez a szövegszerkesztőben ekként jelenik meg:

OmegaTВ∆ВЌБAГRГУГsГЕБ[Г^ВрЧШЧpµšЦ|ЦуГcБ[ГЛВ≈ВЈБB


Ez azonban korántsem orosz, itt a japán karakterek helyén hibásan orosz betűk láthatók.

A többi alkalmazáshoz hasonlóan ez gondot okoz az OmegaT-nek is. Mindössze annyit feltételezhet, hogy alaphelyzetben az egyszerű szöveges állományok a rendszer alapbeállításával megjeleníthetők. Ez nem jelent gondot, ha francia gépen kell a szöveget lefordítani angolra, vagy német gépen kell megnyitni olasz állományokat.


Karakterkészletek és kódolás

Miért működik jól az angol és a francia esetén, és miért gond az orosz vagy a japán? Azért, mert az angol és a francia azonos karakterkészletet használ. Éspedig a Latin-1-et vagy annak egy változatát. Egészen mostanáig az orosz és a japán nyelv eltérő karakterkészleteket használt. Az orosz karakterek nem feleltek meg a japánoknak, és fordítva. Ennek eredménye látható fent.

A japán megbízó japán gépen dolgozik és japán szöveges állományokat hoz létre. Az ügyfél által kiválasztott karakterkészlet az operációs rendszertől és egyéb beállításoktól függ, de bizonyára a kiválasztott (japán) karakterkészlet nem jelenik meg helyesen az orosz számítógépen.

Az, hogy egy karakterkészletben az adott szöveg fizikailag miként jelenik meg (vagyis a számítógép miként olvassa azt be és jeleníti meg), a kódolástól függ. Amikor a számítógép beolvassa az állományt, a kódolásnak megfelelően "dekódolja" az információt és a karakterkészletnek megfelelően jeleníti meg. Alapvetően egy kódolás egy karakterkészletnek felel meg...


Az OmegaT által kínált megoldás

A helyzet kezelésére az OmegaT három alapvető megoldást kínál. Ezek mindegyike az állományszűrők alkalmazását feltételezi a Beállítások menüben .

  1. Adja meg egyszerű szöveges állományainak - azaz a .txt kiterjesztésűeknek a kódolását az Egyszerű szövegek párbeszédablakban az állományszűrők alatt, éspedig úgy, hogy módosítja a Forrásállomány kódolását <auto>-ról arra az értékre, amelyik megfelel .txt kiterjesztésű forrásállományának.
  2. Módosítsa egyszerű szöveges állományainak kiterjesztését (például japán szöveg esetén .txt-ről .jp-re): Az Egyszerű szövegek párbeszédablakban az állományszűrők alatt vegyen fel egy új névmintát a forrásállományhoz (például *.jp) és válassza ki a megfelelő kódolásokat a forrásnyelvhez és a célnyelvhez.
  3. Állományainak kódolását módosítsa unikódra: nyissa meg a forrásállományt egy olyan szövegszerkesztőben, amely megfelelően kezeli annak kódolását, majd mentse el az állományt "UTF-8" kódolásban. Az állomány kiterjesztését módosítsa .txt-ről .utf8-ra. Az OmegaT az állományt UTF-8 kódolású állományként fogja kezelni.

Az OmegaT alaphelyzetben az alábbi lehetőségeket kínálja fel az egyszerű szövegek kezeléséhez:

Ellenőrizheti a beállítást, ha az Állományszűrők pontra kattint a Beállítások menüben. Ha például cseh szöveggel van dolga (amely feltehetőleg ISO-8859-2 kódolású), akkor mindössze annyi a dolga, hogy a .txt-kiterjesztést .txt2-kiterjesztésre módosítja, melynek eredményeként az OmegaT annak tartalmát helyesen fogja értelmezni. Ha pedig teljesen biztosra akar menni, alakítsa át az efféle állományokat unikódba, azaz .utf8 állományformára.


Jogi tudnivalók Kezdőoldal Tartalomjegyzék