При работе в OmegaT с двунаправленным письмом существует две проблемы: 1) ввод текста 2) показ текста. При вводе текста с письмом справа налево (например, урду, арабский и т.п.) и использовании стандартного вида (а это происходит по умолчанию) текст не всегда показывается в том же порядке, в каком вводится. Это не очевидно при вводе чистого RTL-текста, и в этом случае можно использовать стандартный вид.
Однако если язык перевода является RTL-языком, иногда становится необходимым вставить обычный текст. Например, некоторые названия продуктов нужно оставить английскими или оставить оригинальные строки во время локализации пользовательского интерфейса программы.
Когда обычный текст вставлен в текст с письмом справа налево, он показывается не в том порядке, в котором вводится. Вид переключается клавиатурной комбинацией Ctrl+Shift+O
.
Примечание: эту же комбинацию можно использовать на Mac OSX.
RTL-текст проще вводить при RTL-виде, поскольку в стандартном виде при вводе RTL-текста введённые пробелы сначала появляются справа от вводимого текста, а следующий RTL-символ появляется слева.
Комбинация Ctrl+Shift+O
переключает ввод и показ текста в RTL-режим. Её можно использовать отдельно для каждой из трёх панелей (редактирование, нечёткие совпадения, глоссарий).
После создания переведённого документа он будет показываться в стандартном виде, как исходный документ. Это можно исправить вручную. Каждый формат имеет свою специфику работы с показом RTL-текста; обратитесь к руководству соответствующего приложения за подробной информацией.
При помощи OmegaT вы можете переводить файлы нескольких форматов. В целом есть два типа форматов файлов: текстовые (plain text) форматы и форматы форматированного текста.
Текстовые файлы содержат только текст, поэтому их перевод сводится к набору опять же текста.
Есть несколько методов указания кодировки файла, чтобы его содержимое не искажалось при открытии в OmegaT.
В таких файлах форматирование не выходит за пределы пробелов, которые используются для отступов и выравнивания. Для их изменения применяются текстовые редакторы и обычно такие форматы не способны хранить информацию о шрифтах, цветах, полях и т.п.
В настоящее время OmegaT поддерживает следующие текстовые форматы:
Другие типы текстовых файлов также могут быть обработаны в OmegaT через ассоциирование их расширения с поддерживаемым типом файлов (например, .pod
-файлы можно ассоциировать с текстовым фильтром ASCII) и через настройку специфических правил сегментирования.
Файлы с форматированным текстом содержат сам текст и информацию о начертании, размере и цвете шрифта и т.п. Их обычно создают в текстовых процессорах или редакторах домашних страниц.
Эти файлы сохраняют информацию о форматировании. Эта информация может быть очень простой, например, это полужирный шрифт или сложной, например, таблицы с разными размерами, цветами и расположением шрифтов и т.п.
В большинстве переводческих задач очень важно, чтобы переведённый документ выглядел похожим на оригинал. OmegaT позволяет добиться этого, отмечая символы и слова с форматированием особыми тэгами.
Упрощение форматирования исходного текста уменьшает количество тэгов. Если это возможно, постарайтесь унифицировать используемые шрифты, размеры, цвета и т.п., чтобы упростить перевод и уменьшить вероятность ошибок, связанных с тэгами.
В настоящее время OmegaT поддерживает следующие форматы форматированного текста:
Другие типы файлов с форматированием также могут быть обработаны в OmegaT через ассоциирование их расширения с поддерживаемым типом файлов и через настройку специфических правил сегментирования.
Каждый тип файлов обрабатывается в OmegaT по-своему. Специфические настройки можно задать в файловых фильтрах.
OmegaT также может работать с другими форматами файлов.
Для преобразования неподдерживаемых файлов в поддерживаемые форматы можно использовать внешние утилиты. Переведённые файлы нужно будет сконвертировать обратно в исходный формат. Таким образом, многие текстовые форматы (включая LaTex и т.д.) можно переводить в OmegaT после конвертации в формат PO. Аналогично, многие форматы форматированного текста (включая файлы Microsoft Office) можно переводить в OmegaT после конвертации в формат OpenDocument.
Качество переведённого файла будет зависеть от качества обратной конвертации. Удостоверьтесь, что проверили все настройки, прежде чем производить такую конвертацию.
Среди доступных свободных инструментов конвертации можно отметить:
OmegaT напрямую не поддерживает форматы Microsoft Office, например, Word, Excel и PowerPoint. Однако можно использовать OpenOffice.org (и его варианты) для конвертации таких файлов в формат OpenDocument, который OmegaT поддерживает.
Официальная веб-страница OpenOffice.org
Утилита Text Extraction из Okapi Framework способна создавать дерево каталогов проекта OmegaT. Кроме того, возможно создать XLIFF-файл специально для OmegaT. Okapi недавно выпустила инструменты, работающие под Mono, свободной платформой, которая доступна на большинстве операционных систем.
Страница релиза Okapi под Mono, учебник
Translate Toolkit, набор инструментов на Python, предоставляет конвертеры из и в Portable Object, включая .properties и dtd-файлы Mozilla, CSV-файлы, .ts-файлы Qt, XLIFF-файлы. Он включает утилиты для обработки таких файлов до или после их перевода в OmegaT.
Официальная веб-страница Translate Toolkit
po4a - это утилита на Perl в Linux-дистрибутиве Debian. Она умеет конвертировать такие форматы как LaTeX, TeX, POD и т.д. из и в Portable Object.