Работа с форматированными текстами

Информация о форматировании в исходном файле обычно должна быть воспроизведена в файле перевода. Информация о форматировании в поддерживаемых файлах (в настоящее время DocBook, HTML, XHTML, Open Document и OpenOffice.org) представлена в OmegaT тэгами. В большинстве случаев тэги игнорируются при оценке схожести текстов для подбора совпадений. Тэги, которые вы воспроизвели в переведённом сегменте, будут перенесены в переведённый документ.


Формат тэгов

Именование тэгов:: Тэги состоят из одного, двух или трёх символов и номера. Уникальный номер позволяет группировать тэги и различать те из них, которые отображены одинаковыми символами, но на самом деле различны. Символы не обязательно отражают значение форматирования, которое представляет данный тэг (например, жирный шрифт, курсив и т.д.)

Нумерация тэгов: Тэги нумеруются в порядке возрастания по группам тэгов. То, что мы называем "группой тэгов", является либо самостоятельным одиночным тэгом (например, <br1>), либо двумя тэгами, которые образуют пару (например, <i0> и </i0> ). Внутри сегмента первая группа (пара или одиночный тэг) получает номер 0, вторая - номер 1 и так далее. В первом примере ниже есть три группы тэгов (пара, одиночный тэг, затем снова пара), во втором примере только одна группа (пара).

Парные и одиночные тэги:Тэги всегда являются либо одиночными, либо парными. Одиночные тэги означают информацию о форматировании, которое не затрагивает окружающий текст (например, дополнительный пробел или разрыв строки).

        <сегмент 2132><b0><Ctr+N></b0>, <br1><b2><Enter></b2><конец сегмента>

<br1> - это одиночный тэг, он не затрагивает текст вокруг себя. Парные тэги обычно означают информацию о стиле, который применяется к тексту между открывающим и закрывающим тэгами пары. Что бы ни случилось с парой, открывающий тэг всегда должен находиться перед закрывающим.

        <сегмент 3167>Log file (<b0>log.txt</b0>) for tracking operations and errors.<конец сегмента>

<b0> и </b0> являются парными и влияют на строку log.txt.


Тэги и сегментирование по предложениям

OmegaT создаёт свои тэги до того, как применяется сегментирование по предложениям. В зависимости от правил сегментирования, может показаться, что тэги иногда перестают соблюдать вышеперечисленные правила нумерации и группировки. Посмотрим на следующий текст: "Before: \. After: \s". Можно было бы ожидать такого сегментирования (<b0> и </b0> означают начало и конец курсива):

        <сегмент ....> <b0>Before: \. After: \s</b0><конец сегмента>

Однако, если к этому сегменту применить правила сегментирования по умолчанию, то получится следующий результат:

        <сегмент 1990> <b0>Before: \. <конец сегмента>
<сегмент 1991> After: \s</b0><конец сегмента>   

Применение правила сегментировать после точки и пробела разделяет исходный текст на два сегмента, даже если два тэга <b0> и </b0> должны быть вместе в одном сегменте. Иногда это может вызвать проблемы, когда нужно по-другому разместить тэги в переводе, чтобы отразить порядок слов языка перевода (см. ниже Операции с тэгами).


Операции с тэгами

С тэгами нужно обращаться осторожно. Если их случайно изменить, может быть нарушено форматирование конечного файла. Разумным будет подход "Не чини то, что не сломано". Тем не менее, полезно знать свои возможности и то, как их можно использовать.

Копирование групп тэгов: Чтобы дублировать группу тэгов, просто скопируйте их в желаемое место. Помните, что открывающий тэг всегда должен находиться перед закрывающим. Форматирование, представленное группой, которую вы дублировали, будет применено к тому месту, куда было произведено копирование.

Пример:

        <сегмент 0001><b0>Это форматирование</b0> будет применено здесь.<конец сегмента>

После копирования:

        <сегмент 0001><b0>Это форматирование</b0> было <b0>скопировано сюда</b0>.<конец сегмента>

Удаление групп тэгов: Чтобы удалить группу тэгов, просто уберите её из сегмента. Помните, что нужно удалить как открывающие, так и закрывающие тэги и убедиться, что все следы форматирования действительно стёрты. Иначе переведённый файл может испортиться. Удаляя группу тэгов, вы удаляете соответствующее форматирование из переведённого файла.

Пример:

        <сегмент 0001><b0>Это форматирование</b0> будет удалено.<конец сегмента>

После удаления:

        <сегмент 0001>Это форматирование было удалено.<конец сегмента>

Изменение порядка групп тэгов: Чтобы переместить группу тэгов в соответствии с другой структурой языка перевода, просто передвиньте группу туда, где она должна находиться в переводе. Форматирование переместится туда же.

Пример:

        <сегмент 0001><b0>Форматирование ноль</b0> и <b1>форматирование один</b1> поменяются местами.<конец сегмента>

После изменений:

        <сегмент 0001><b1>Форматирование один</b1> и <b0>форматирование ноль</b0> поменялись местами.<конец сегмента>

Иерархия групп тэгов

Изменение групп тэгов может привести к тому, что одна группа будет вложена в другую. Это не опасно, только если внешняя группа полностью окружает вложенную. Другими словами, при перемещении парных тэгов, всегда следите за тем, что и открывающий и закрывающий тэги перенеслись в перевод. В ином случае переведённый файл может испортиться и перестать открываться. К вложенной части будут применены оба форматирования.

Пример:

        <сегмент 0001><b0>Форматирование</b0> <b1>один</b1> будет вложено внутрь форматирования ноль.<конец сегмента>

После вложения:

        <сегмент 0001><b0>Форматирование <b1>один</b1></b0> теперь вложено в форматирование ноль.<конец сегмента>

Перекрывающиеся группы тэгов

Перекрывание является результатом некорректных манипуляций с парами тэгов и практически всегда приводит к порче форматирования, а иногда и к тому, что переведённый файл перестаёт открываться вообще. Пример:

        <сегмент 0001><b0>Форматирование</b0> <b1>один</b1> сейчас испортится.<конец сегмента>

После некорректных манипуляций:

        <сегмент 0001><b0>Форматирование <b1>один</b0> </b1>успешно испорчено.<конец сегмента>

Проверка групп тэгов

Функция проверки тэгов определяет измененные (намеренно или случайно) тэги и показывает затронутые сегменты. Вызов этой функции - посредством нажатия Ctrl-T - откроет окно, в котором перечислены все сегменты, для которых есть подозрение на некорректную передачу тэгов в переводе. Ошибки при переводе файлов с тэгами часто вызывают проблемы с файлами OpenDocument или OpenOffice.org, поскольку их может быть невозможно открыть из-за проблем с тэгами, появившихся в процессе перевода. Исправить тэги и пересоздать файлы перевода вам поможет функция "Проверка тэгов".

Окно, которое открывается по нажатию Ctrl-T, содержит таблицу из трёх столбцов:

Тэги выделены жирным шрифтом и синим цветом, чтобы можно было легко сравнить содержимое оригинала и перевода. Щелкните по ссылке, чтобы активировать сегмент в окне редактирования. При необходимости исправьте ошибку и нажмите Ctrl+T, чтобы вернуться к окну проверки тэгов и исправить следующие ошибки. Ошибки тэгов - это манипуляции с тэгами, которые не воспроизводят в тексте перевода тот же порядок и количество тэгов, что в исходном сегменте. Некоторые изменения тэгов необходимы и с ними приходится мириться, другие вызовут проблемы после создания переведённого документа.


Подсказки по управлению тэгами

Обычно тэги несут какую-то информацию о форматировании исходного текста. Упрощение форматирования исходного текста уменьшает количество тэгов. Если это возможно, постарайтесь унифицировать используемые шрифты, размеры, цвета и т.п., так как это упрощает перевод и уменьшает количество возможных ошибок, связанных с тэгами. Прочитайте раздел Операции с тэгами, чтобы получить представление о том, что можно с ними делать. Имейте в виду, что если тэги вас раздражают, а форматирование не очень важно для текущего перевода, то удаление тэгов может стать решением проблемы.

Если вы хотите видеть тэги в OmegaT, но вам не нужно сохранять большую часть форматирования в переведённом документе, вы можете просто не добавлять тэги в перевод. В этом случае обратите особое внимание на пары тэгов, поскольку если вы удалите одну из частей пары, но забудете удалить другую, то форматирование вашего документа испортится. Поскольку тэги являются частью текста, вы можете использовать Правила сегментирования, чтобы создавать сегменты с меньшим количеством тэгов. Это дополнительная функция и для её правильного применения необходим опыт.

Важно: в настоящее время OmegaT не умеет полностью автоматически определять ошибки в форматировании, поэтому не отличает ошибок от изменений, сделанных в рамках адаптации оформления под язык перевода. Однако, иногда переведённый файл может выглядеть испорченным, а в случае с файлами OpenDocument / OpenOffice.org - даже отказаться открываться.


Надлежащие уведомления Наверх Карта документации