Les filtres extrêmement personnalisables d'OmegaT vous permettent de configurer de nombreuses choses. Les filtres sont des morceaux de code capables de :
Lire un document possédant un format de fichier spécifique. Par exemple, les fichiers texte brut.
Extraire le contenu traductible du fichier.
Modifier automatiquement les noms de fichier des documents traduits en remplaçant le contenu traductible par sa traduction.
Pour savoir quels formats de fichier peuvent être traités par OmegaT, voir le menu
La plupart des utilisateurs trouveront les options de filtrage de fichiers par défaut suffisantes. Si ce n'est pas votre cas, ouvrez la boite de dialogue en sélectionnant Options → Fichiers et filtres.... Vous pouvez également activer des filtres de fichiers spécifiques au projet, qui seront utilisés uniquement pour le projet en cours, en sélectionnant l'option Fichiers et filtres... dans Projet → Propriétés....
Vous pouvez activer le filtre de fichiers spécifiques au projet via Projet → Propriétés.... Cliquez sur le bouton et cochez la case . Une copie de la configuration des filtres sera alors enregistrée avec le projet. Si vous changez les filtres par la suite, seul les filtres du projet seront mis à jour, tandis que les filtres utilisateur resteront inchangés.
Attention ! Si vous changez les options de filtrage alors que le projet est ouvert, vous devrez fermer et redémarrer le projet pour que les modifications soient prises en compte.
Cette boite de dialogue liste les filtres de fichiers disponibles. Si vous décidez de ne pas utiliser OmegaT pour traduire des fichiers d'un certain type, vous pouvez fermer le filtre correspondant en décochant la case qui se trouve à côté du nom de format de fichier. OmegaT laissera alors de côté les fichiers appropriés lors du chargement du projet et les copiera sans les modifier lors de la création des documents cible. Si vous souhaitez réutiliser le filtre, re-cochez simplement la case correspondante. Cliquez sur Valeurs par défaut pour que les filtres de fichiers retrouvent leurs valeurs par défaut. Pour modifier le type et l'encodage des fichiers à traiter par un filtre, sélectionnez le filtre dans la liste et cliquez sur Modifier...
Certains filtres (Fichiers textes, XHTML, HTML, XHTML, OpenDocument et Microsoft Open XML) disposent d'une ou plusieurs options spécifiques. Pour modifier ces options, sélectionnez le filtre dans la liste et cliquez sur Options.... Les options disponibles sont :
Fichiers texte
Segmenter le texte source en paragraphes (basés) sur : fin de lignes, lignes vides ou jamais.
Si les règles de segmentation par phrases sont actives, le texte sera segmenté en fonction des options sélectionnées ici.
Fichiers PO
Permet les traductions vides dans le fichier cible :
S'il est activé, lorsqu'un segment PO (qui peut représenter un paragraphe entier) n'est pas traduit, la traduction sera vide
dans le fichier cible. De façon pratique, cela signifie que le segment msgstr
dans le fichier cible PO, s'il est créé, sera laissé vide. Ceci étant le comportement standard pour les fichiers PO, il est
activé par défaut. Si cette option est désactivée, le texte source sera copié dans le segment cible.
Ignorer l'en-tête des fichiers PO
L'en-tête des fichiers PO sera ignorée et laissée inchangée, si cette option est activée.
Remplacement automatique de 'nplurals=INTEGER; plural=EXPRESSION;' dans l'en-tête
Cette option permet à OmegaT de remplacer la spécification dans l'en-tête du fichier PO et d'utiliser la valeur par défaut pour la langue cible sélectionnée.
Fichiers XHTML
Ajouter ou réécrire une déclaration d'encodage dans les fichiers HTML et XHTML : généralement, les fichiers cibles doivent posséder un jeu de caractères d'encodage différent de celui présent dans le fichier source (que cela soit défini explicitement ou implicitement). En utilisant cette option, le traducteur peut spécifier si les fichiers cibles doivent inclure la déclaration d'encodage. Par exemple, si le filtre de fichiers désigne UTF8 comme système d'encodage pour les fichiers cibles, sélectionner « Toujours » permettra de s'assurer que cette information est inscrite dans les fichiers cibles.
Traduire les attributs suivants : les attributs sélectionnés apparaîtront en tant que segments dans la fenêtre de l'Éditeur.
Commencer un nouveau paragraphe sur : <br> (rupture de ligne), cette balise HTML créera un paragraphe du point de vue de la segmentation.
Ignorer le texte correspondant à une expression régulière : le texte correspondant à l'expression régulière choisie est ignoré. Il est affiché en rouge dans le validateur de balise. Le texte dans les segments source correspondants est affiché en italique.
Ne pas traduire l'attribut content des balises méta ... : les balises méta ne seront pas traduites.
Ne pas traduire le contenu des balises comportant les paires de clé-valeur d'attribut suivantes (séparées par des virgules) : une correspondance dans la liste des paires de valeur-clé aura pour effet de faire ignorer le contenu de la balise
Il est parfois utile de rendre certaines balises intraductibles en se basant sur la valeur de leurs attributs. Par exemple,
<div class="hide"> <span translate="no">
Vous pouvez définir des paires de valeur-clé pour les balises qui doivent rester non traduites. Pour reprendre l'exemple
ci-dessus, le champ contiendrait : class=hide, translate=no
Fichiers Microsoft Office Open XML
Vous pouvez sélectionner les éléments qui doivent être traduits. Ils apparaîtront en segments séparés dans la traduction.
Word : texte d'instruction non-visible, commentaires, notes de bas de pages, notes de fin de document, pieds de page
Excel : commentaires, noms des feuilles
Power Point : commentaires des diapositives, masques des diapositives, mise en page des diapositives
Global : graphiques, diagrammes, dessins, WordArt
Autres options :
Agréger les balises : si cette case est cochée, les balises qui ne contiennent pas de texte traductible entre elles seront rassemblées en une seule balise.
Préserver les espaces pour toutes les balises : si cette case est cochée, les « caractères d'espacement » (c.-à-d. les espaces et les sauts de ligne) seront préservés, même s'ils ne sont pas définis techniquement dans le document
Fichiers HTML et XHTML
Ajoute ou réécrit une déclaration d'encodage dans les fichiers HTML et XHTML : : Toujours (valeur par défaut), Seulement si le fichier (X)HTML a un en-tête, Seulement si le fichier (X)HTML a une déclaration d'encodage, Jamais
Traduire les attributs suivants : les attributs sélectionnés apparaîtront en tant que segments dans la fenêtre de l'Éditeur.
Commencer un nouveau paragraphe sur : <br> (rupture de ligne), cette balise HTML créera un paragraphe du point de vue de la segmentation.
Ignorer le texte correspondant à une expression régulière : le texte correspondant à l'expression régulière choisie est ignoré.
Ne pas traduire l'attribut content des balises méta ... : les balises méta ne seront pas traduites.
Ne pas traduire le contenu des balises comportant les paires de clé-valeur d'attribut suivantes (séparées par des virgules) : une correspondance dans la liste des paires de valeur-clé aura pour effet de faire ignorer le contenu de la balise
Fichiers texte
Segmenter le texte source en paragraphes (basés) sur : fins de ligne, lignes vides ou jamais :
Si les règles de segmentation par phrases sont actives, le texte sera segmenté en fonction des options sélectionnées ici.
Fichiers Open Document Format (ODF)
Vous pouvez sélectionner ce qui doit être traduit parmi les éléments suivants :
Entrées d'index, signets (repère de texte), références aux signets, notes, commentaires, notes des présentations, liens (URL), noms des feuilles
Cette boite de dialogue vous permet de créer les masques de noms de fichiers source des fichiers qui vont être traités par le filtre, de personnaliser les noms des fichiers traduits, et de sélectionner les encodages qui doivent être utilisés pour charger le fichier et enregistrer sa traduction. Pour modifier un masque de filtre de fichier, modifiez directement les champs concernés ou cliquez sur Modifier.... Pour ajouter un nouveau masque de nom de fichier, cliquez sur Ajouter. La même boite de dialogue est utilisée pour ajouter un masque ou pour modifier un masque particulier. La boite de dialogue est utile car elle contient un éditeur de masque de noms de fichiers cible spécial qui vous permet de personnaliser le nom des fichiers de sortie.
Lorsqu'OmegaT rencontre un fichier dans le dossier source, il tente de sélectionner le filtre basé sur l'extension du fichier.
Plus exactement, OmegaT tente de faire correspondre chaque masque de nom de fichier de fichier source avec le nom de fichier.
Par exemple, le masque *.xhtml
correspond à tous les fichiers possédant l'extension .xhtml
. Si le filtre approprié est trouvé, le fichier lui est attribué pour qu'il puisse le traiter. Par exemple, par défaut, les
filtres XHTML sont utilisés pour traiter les fichiers qui portent l'extension .xhtml. Vous pouvez changer ou ajouter des masques
de nom de fichier pour que les fichiers soient traités par type de fichier. Les masques de nom de fichier source utilisent
des caractères génériques similaires à ceux utilisés dansRechercher... Le caractère « * » correspond à zéro, un ou plusieurs caractères. Le caractère « ? » correspond à exactement un caractère.
Tous les autres caractères ne correspondent qu'à eux-même. Par exemple, si vous souhaitez que le filtre texte traite les fichiers
lisez-moi (=readme, read.me
, et readme.txt
) vous devez utiliser le masque read*
.
Seul un nombre limité de formats de fichier définissent un encodage obligatoire. Les formats de fichier qui ne définissent
pas leur encodage utiliseront l'encodage que vous avez mis en place pour l'extension qui correspond à leur nom. Par exemple,
par défaut, les fichiers .txt
seront chargés en utilisant l'encodage par défaut de votre système d'exploitation. Vous pouvez changer l'encodage source pour
chacun des différents masques de nom de fichier source. Ces fichiers peuvent ainsi être écrits dans n'importe quel encodage.
Par défaut, l'encodage du fichier traduit est le même que celui du fichier source. Les champs d'encodage cible et source utilisent
des listes déroulantes incluant tous les encodages supportés. <auto> laisse le choix de l'encodage à OmegaT. Voici comment cela fonctionne :
OmegaT identifie l'encodage du fichier source en utilisant sa déclaration d'encodage, si celle-ci est présente (fichier HTML, les fichiers à base XML)
OmegaT est conçu pour utiliser un encodage obligatoire pour certains formats de fichier (propriétés de Java, etc)
OmegaT utilise l'encodage par défaut du système d'exploitation pour les fichiers texte.
Il peut arriver que vous ayez envie de renommer les fichiers que vous avez traduits automatiquement, en ajoutant, par exemple, un code de langue après le nom du fichier. Le masque de nom de fichier cible utilise une syntaxe spéciale, de sorte que si vous voulez modifier ce champ, vous devez cliquer sur Modifier... et utiliser la boite de dialogue Modifier le masque. Si vous souhaitez retourner à la configuration par défaut du filtre, cliquez sur Valeurs par défaut. Vous pourrez ainsi modifier le nom directement dans le champ de masque de nom de fichier cible présent dans la boite de dialogue des filtres de fichiers. La boite de dialogue « Modifier le masque » propose ces options :
Par défaut, ${filename}
– est le nom de fichier complet du fichier source avec son extension : dans ce cas le nom du fichier traduit est le même que
celui du fichier source.
${nameOnly}
– vous permet d'insérer seulement le nom du fichier source sans y ajouter l'extension.
${extension}
- l'extension du fichier original
${targetLocale}
– code local de la cible (sous la forme "xx_YY").
${targetLanguage}
– la langue cible et le code du pays ensemble (sous la forme "XX-YY").
${targetLanguageCode}
– la langue cible - seulement "XX"
${targetCountryCode}
– le pays cible - seulement "YY"
${timestamp-????}
– date et heure du système au moment de la génération des différents masques
Voir la documentation Oraclepour des exemples de masques « SimpleDateFormat »
${system-os-name}
- utilise le système d'exploitation de l'ordinateur
${system-user-name}
- le nom de l'utilisateur du système
${system-host-name}
- le nom d'hôte du système
${file-source-encoding}
- encodage du fichier source
${file-target-encoding}
- encodage du fichier cible
${targetLocaleLCID)
- paramètres locaux cible Microsoft
Des variantes additionnelles sont disponibles pour les variables : ${nameOnly} et ${Extension}. Si le nom du fichier est ambivalent,
il est possible d'appliquer des variables de type : ${nom seul
-numéro de l'extension} et ${extension
-numéro de l'extension} . Si, par exemple, le fichier original est appelé Document.xx.docx, les variables suivantes auront pour résultat :
${nameOnly-0}
Document
${nameOnly-1}
Document.xx
${nameOnly-2}
Document.xx.docx
${extension-0}
docx
${extension-1}
xx.docx
${extension-2}
Document.xx.docx