Os ficheiros de texto plano (na maioría dos casos, ficheiros coa extensión .txt) conteñen só información textual e ofrecen un xeito non moi definido de informar ao computador que idioma conteñen. O mellor que pode facer OmegaT neste caso é asumir que o texto está escrito no mesmo idioma que emprega o propio computador. Isto non é un problema para os ficheiros codificados en Unicode e cun sistema de caracteres de 16 bits. Se o texto está codificado en 8 bits, porén, un pode enfrontarse á seguinte situación: en vez de amosar o texto en caracteres xaponeses...
...o sistema amosará o texto como isto, por exemplo:
O computador que executa OmegaT ten ruso coma idioma predeterminado, polo que amosa os caracteres en alfabeto cirílico e non en kanji.
Hai basicamente tres xeitos para enfrontarse a este problema en OmegaT. Todos están relacionados coa aplicación de filtros de ficheiro no menú de Opcións.
abrir o ficheiro orixe nun editor de texto que interprete correctamente a codificación e gardar o ficheiro coa codificación
«UTF-8». Cambiar a extensión do ficheiro de .txt
a .utf8.
OmegaT interpretará automaticamente o ficheiro coma un ficheiro UTF-8. Esta é a alternativa de máis sentido común, que soluciona
os seus problemas a longo prazo.
é dicir, ficheiros coa extensión .txt
: na sección Ficheiros de texto no diálogo de filtros de ficheiro, cambie a Codificación do ficheiro orixe de <auto> á codificación que corresponda ao seu ficheiro orixe .txt
, por exemplo, a .jp para o exemplo anterior.
por exemplo, de .txt
a .jp
para textos planos en xaponés: na sección Ficheiros de texto do diálogo de filtros de ficheiro, engada un novo Padrón de nome de ficheiro de orixe (*.jp
para este exemplo) e seleccione os parámetros apropiados para a codificación de orixe e destino.
OmegaT ten dispoñíbel a seguinte lista predeterminada para facerlle máis fácil a solución ao problema con algúns ficheiros de texto plano:
Os ficheiros .txt
son interpretados automaticamente (<auto>) por OmegaT como se estivesen codificados coa codificación predeterminada do computador.
Pode comprobalo persoalmente seleccionando Filtros de ficheiro no menú Opcións. Por exemplo, se ten un ficheiro de texto en checo (moi probabelmente escrito coa codificación ISO-8859-2), simplemente necesitaría cambiar a extensión .txt
a .txt2
e OmegaT interpretará correctamente os seus contidos. E, por suposto, se desexa estar seguro, considere converter o tipo de ficheiro
a Unicode, é dicir, ao formato de ficheiro .utf8
.