Работа с форматированными текстами

Информация о форматировании в исходном файле обычно должна быть воспроизведена в файле перевода. OmegaT отображает информацию о форматировании в поддерживаемых файлах (в настоящее время DocBook, HTML, XHTML, Open Document и OpenOffice.org) как тэги. Обычно тэги не принимаются во внимание при оценке схожести строк для подбора совпадений. Тэги, которые вы воспроизвели в переведённом сегменте, будут перенесены в переведённый документ.


Тэги форматирования

Именование тэгов

Тэг состоит из одного, двух или трёх символов и номера. Уникальный номер позволяет группировать тэги и различать те из них, которые отображены одинаковыми символами, но на самом деле различны. Символы не обязательно отражают значение форматирования, которое представляет данный тэг (например, жирный шрифт, курсив и т.д.)

Нумерация тэгов

Тэги нумеруются в порядке возрастания по группам тэгов. То, что мы называем "группой тэгов", является либо самостоятельным одиночным тэгом (например, <br1>), либо двумя тэгами, которые образуют пару (например, <f3> и </f3>). Внутри сегмента первая группа (пара или одиночный тэг) получает номер 0, вторая - номер 1 и так далее. В первом примере ниже есть три группы тэгов (пара, одиночный тэг, затем снова пара), во втором примере только одна группа (пара).

Парные и одиночные тэги

Тэги всегда являются либо одиночными, либо парными. Одиночные тэги означают информацию о форматировании, которое не затрагивает окружающий текст(например, дополнительный пробел или разрыв строки).

	<сегмент 2132><b0><Ctr+N></b0>, <br1><b2><Enter></b2><конец сегмента>

<br1> - это одиночный тэг, он не затрагивает текст вокруг себя. Парные тэги обычно означают информацию о стиле, который применяется к тексту между открывающим и закрывающим тэгами пары. Что бы ни случилось с парой, открывающий тэг всегда должен находиться перед закрывающим.

	<сегмент 3167>Log file (log.txt) for tracking operations and errors.<конец сегмента>

<f1> и </f1> являются парными тэгами и влияют на строку log.txt.


Тэги и сегментирование по предложениям

OmegaT создаёт свои тэги до того, как применяется сегментирование по предложениям. В зависимости от правил сегментирования, тэги иногда могут перестать соблюдать вышеперечисленные правила нумерации и группировки.

	<сегмент 1554> <f0>Before: \. After: \s</f0><конец сегмента>

Здесь всё в порядке. Теперь, если мы применим стандартные правила сегментирования (поведение OmegaT по умолчанию), то получим следующее:

	<сегмент 1990> <f0>Before: \. <конец сегмента>
	<сегмент 1991> After: \s</f0><конец сегмента>
	

Здесь применяется правило сегментировать после точки с пробелом справа. В данном примере мы видим, что сегменты по отдельности не соблюдают правила парности и нумерации:<f0> и </f0> должны быть парой в одном сегменте, но правила сегментирования разделили их. Иногда это может вызвать проблемы в переводе, когда нужно перемещать тэги в переводе, чтобы отразить порядок слов языка перевода (см. ниже Операции с тэгами).


Операции с тэгами

С тэгами нужно обращаться осторожно. Если их случайно изменить, может быть нарушено форматирование конечного файла. Разумным будет подход "Не чини то, что не сломано". Тем не менее, полезно знать свои возможности и то, как их можно использовать.

Дублирование группы тэгов:

Чтобы дублировать группу тэгов, просто скопируйте их в желаемое место. Помните, что открывающий тэг всегда должен находиться перед закрывающим. Форматирование, представленное группой, которую вы дублировали, будет применено к тому месту, куда было произведено копирование.

Пример:

	<сегмент 0001><f0>Это форматирование</f0> будет применено здесь.<конец сегмента>

После копирования:

	<сегмент 0001><f0>Это форматирование</f0> было <f0>скопировано сюда</f0>.<конец сегмента>

Удаление группы тэгов

Чтобы удалить группу тэгов, просто уберите её из сегмента. Помните, что нужно удалить как открывающие, так и закрывающие тэги и убедиться, что все следы форматирования действительно стёрты. Иначе переведённый файл может испортиться и не открываться. Удаляя группу тэгов, вы удаляете соответствующее форматирование из переведённого файла.

Пример:

	<сегмент 0001><f0>Это форматирование</f0> будет удалено.<конец сегмента>

После удаления:

	<сегмент 0001>Это форматирование было удалено.<конец сегмента>

Изменение порядка группы тэгов

Чтобы переместить группу тэгов в соответствии с другой структурой языка перевода, просто передвиньте группу туда, где она должна находиться в переводе. Форматирование переместится туда же.

Пример:

	<сегмент 0001><f0>Форматирование ноль</f0> и форматирование один поменяются местами.<конец сегмента>

После изменений:

	<сегмент 0001>Форматирование один и <f0>форматирование ноль</f0> поменялись местами.<конец сегмента>

Иерархия групп тэгов

Изменение групп тэгов может привести к тому, что одна группа будет вложена в другую. Это возможно только если внешняя группа полностью окружает вложенную. Нужно быть особенно осторожным при операциях с вложенными группами. Если пары тэгов не полностью переместились внутрь внешней группы, переведённый файл может испортиться и перестать открываться. К вложенной части будут применены оба форматирования.

Пример:

	<сегмент 0001><f0>Форматирование</f0> один будет вложено внутрь форматирования ноль.<конец сегмента>

После вложения:

	<сегмент 0001><f0>Форматирование один</f0> теперь вложено в форматирование ноль.<конец сегмента>

Перекрывающиеся группы тэгов

Перекрывание является результатом некорректных манипуляций с парами тэгов и практически всегда приводит к порче форматирования, а иногда и к тому, что переведённый файл перестаёт открываться вообще. Пример:

	<сегмент 0001><f0>Форматирование</f0> один сейчас испортится.<конец сегмента>

После некорректных манипуляций:

	<сегмент 0001><f0>Форматирование один</f0> успешно испорчено.<конец сегмента>

Проверка групп тэгов

Функция проверки тэгов определяет измененные (намеренно или случайно) тэги и показывает затронутые сегменты. Вызов этой функции откроет диалоговое окно со всеми некорректными тэгами в документе.

Она полезна для выявления ошибок в переведённом тексте с тэгами. Часто файлы OpenDocument или OpenOffice.org невозможно открыть из-за проблем с тэгами, появившихся в процессе перевода. Исправление тэгов и пересоздание файлов перевода может решить проблему.

Чтобы открыть это окно, нажмите на Ctrl+T.

Окно состоит из трёх столбцов:

Тэги выделены жирным шрифтом и синим цветом, чтобы можно было легко сравнить содержимое оригинала и перевода.

Щелкните по ссылке, чтобы активировать сегмент в окне редактирования.

При необходимости исправьте ошибку и нажмите Ctrl+T, чтобы вернуться к окну проверки тэгов и исправить следующие ошибки.

Ошибки тэгов - это манипуляции с тэгами, которые не воспроизводят в тексте перевода тот же порядок и количество тэгов, что в исходном сегменте. Некоторые изменения тэгов необходимы и с ними приходится мириться, другие вызовут проблемы после создания переведённого документа.

Обычно тэги несут какую-то информацию о форматировании исходного текста. Упрощение форматирования исходного текста уменьшает количество тэгов.


Подсказки по управлению тэгами

Обычно тэги несут какую-то информацию о форматировании исходного текста. Упрощение форматирования исходного текста уменьшает количество тэгов. Если это возможно, постарайтесь унифицировать используемые шрифты, размеры, цвета и т.п., чтобы упростить перевод и уменьшить вероятность ошибок, связанных с тэгами. Прочитайте раздел Операции с тэгами, чтобы получить представление о том, что можно с ними делать. Имейте в виду, что если тэги вас раздражают, а форматирование не очень важно для текущей работы, то удаление из исходных документов всего форматирования весьма облегчит перевод.

Если вы хотите видеть тэги в OmegaT, но вам не нужно сохранять большую часть форматирования в переведённом документе, вы можете просто не добавлять тэги в перевод. В этом случае обратите особое внимание на пары тэгов, поскольку если вы забудете удалить одну из частей пары, то форматирование документа испортится, что сделает невозможным открытие документа в OpenOffice.org. Поскольку тэги являются частью текста, вы можете использовать Правила сегментирования, чтобы создавать сегменты с меньшим количеством тэгов. Это дополнительная функция и для её правильного применения необходим опыт.

Важно: в настоящее время OmegaT не умеет полностью автоматически определять ошибки в форматировании, поэтому не отличает ошибок от изменений, сделанных в рамках адаптации оформления под язык перевода. Иногда переведённый файл может выглядеть испорченным, а в случае с файлами OpenDocument / OpenOffice.org - даже отказаться открываться.


Надлежащие уведомления