在源文件中表示的格式化信息通常需要在目标文中重新创建。OmegaT 将支持的格式(目前包括DocBook、HTML、XHTML、开放文档和OpenOffice.org)的内嵌格式化信息以标签的形式显示。当为了匹配的目的考虑字符串的相似程度时,标签通常不会被纳入考虑只列。你在已译片段中重新创建的标签将会出现在已译文档中。
标签由一到三个字符和一个数字组成。唯一的数字允许我们将这些标签和相对应的标签组织在一起,不同的标签允许有相同的快捷字符,但实际上并不一样。
所用的字符可以也可以不反映出标签所代表的格式的值。(例如:加粗、斜体等等)
标签以标签组增长方式进行编号。
我们这里所说的“标签组”指的是单个存在的标签(如<br1>
),或者是2个成对的标签,像( <f3>
和 </f3>
)。
在片段中,第一个组(成对或者单个的)获得编号 0,第二个编号为1 ,以此类推。
下面的第一个例子中有3个标签组(一组成对的,一组单个,另一组成对的),第二个例子中只有一组(成对的)。
标签通常以成对或者单个的形式出现。
单个标签 指的是对周边文本没有影响的格式化信息。(例如:额外的空格或者行终止)。
<segment 2132><b0><Ctr+N></b0>, <br1><b2><Enter></b2><end segment>
<br1>
是单个的标签,对周边的文本不产生任何影响。
成对标签通常指对开标签和闭标签之间的文本使用的标签对。无论标签对发生什么情况,开标签总是在闭标签之前出现。
<segment 3167>Log file (<f1>log.txt</f1>) for tracking operations and errors.<end segment>
<f1>
and </f1>
are paired and affect log.txt
.
OmegaT 在句子分割之前进行标签创建工作。根据分段规则,标签看起来也许并不遵守上面的编号和分组规则。
<segment 1554> <c0>Before: \. After: \s</c0>
<b2>Note:</b2>
"\." means the character "."<br3>"\s" means any white space character <end segment>
看起来这里没有任何问题。现在,如果我们将缺省的片段分割规则应用到该段(缺省的OmegaT行为),我们将获得如下结果:
<segment 1990> <c0>Before: \. <end segment> <segment 1991> After: \s</c0><br1><end segment> <segment 1992> <b2>Note:</b2> "\." means the character "."<br3><end segment> <segment 1993> "\s" means any white space character <end segment>
(上例中使用的片段分割规则是: 在一个句点紧跟一个空格之后的片段 和 行终止标签之后的片段)
从这里我们可以看出:片段被一段段地切割,而并不遵守成对和编号规则。 <C0>
和 </C0>
本应在同一片段中成对出现,但它们却被片段分割规则所分开。
当在目标语言中标签必须移位以顺应该语种的词序时,这一情况甚至会导致翻译出现问题,(查阅后面的标签操作 ).
对于标签的操作必须谨慎。如果它们被意外地改变,最终的文件格式也许会被破坏。在最坏的情况下,文件根本无法打开。这种情况对于OpenOffice.org文件特别常见。
要想复制标签组,只需将它们拷贝至你所选择的位置。请记住:成对的标签组中开标签必须出现在闭标签之前。
你复制的标签所代表的格式将会应用到你所复制的部分。
例如:
<segment 0001><f0>This formatting</f0> is going to be duplicated here.<end segment>
复制后:
<segment 0001><f0>Ce format</f0> a été <f0>copié ici</f0>.<end segment>
要删除标签组,只需将它们从片段中删去。请记住:必须同时删去一个标签组的开标签和闭标签,以确保它们所进行的格式化操作被完全清除,否则已译文件可能会被破坏且无法打开。
删除一个标签组的同时,你将会从已译文件中删除相关的格式。
例如:
<segment 0001><f0>This formatting</f0> is going to be deleted.<end segment>
删除后:
<segment 0001>Ce format a été effacé.<end segment>
在翻译中,要改变标签组的顺序来对应不同的语言结构,只需在翻译本文中将标签组放到它应该在的位置。
格式将会紧随它所属的部分。
例如:
<segment 0001><f0>The formatting here</f0> and <f1>the formatting here</f1> are going to be moved around.<end segment>
修改顺序后:
<segment 0001><f1>Ce format</f1> et <f0>ce format</f0> ont été inversés.<end segment>
对标签组的顺序进行修改也许会导致一个标签组嵌套在另一个标签组中。当封闭的组完全将另一个封闭组封装在里面的时候,这是完全有可能的。对于嵌套必须非常小心,尤其是当标签组没有被完整转移到一个封闭组中时,否则已译文件可能被破坏并且无法打开。
嵌套的部分将会拥有应用到它身上的两种格式。
例如:
<segment 0001><f0>The formatting</f0> <f1>here</f1> is going to be nested.<end segment>
嵌套后:
<segment 0001><f0>Le format <f1>ici</f1></f0> a été emboité dans le premier format.<end segment>
对标签对的错误维护将会导致重叠,当然也会导致格式破坏以及某些情况下已译文件根本无法打开。
例如:
<segment 0001><f0>the formatting</f0> <f1>here</f1> is going to be messed up.<end segment>
错误维护后:
<segment 0001><f0>the formatting <f1>here</f0> </f1>is very messed up now.<end segment>
验证标签功能(标签验证) 检测变化了的标签(无论是有意的还是无意的),并指出收到影响的片段。使用该功能将会打开一个对话框,显示出文档中任何可疑的断裂或者被破获的标签。
该项功能对跟踪已译标签文本中的BUG是非常有用的。在对OpenDocument或者OpenOffice.org文件的翻译过程中,经常会因为标签问题导致会导致文件无法打开。修正标签然后重新创建目标文档可以解决该问题。
标签通常代表了原始文本中的某种格式。简化原始文本格式 很大程度上有助于减少标签的数量。如果有可能应该考虑使用统一的字体、字体大小、颜色等,以此简化翻译工作和减少可能的标签错误。
查阅 标签操作 部分了解可以对标签做那些处理。
记住:如果标签使你困扰,而格式又不是手头的工作最至关紧要的事情的话,将源文档中的绝大多数格式删除将会大大降低翻译工作的难度。
如果你需要在OmegaT中看到标签,但是却不需要在已译文档中保留绝大多数格式的话,你可以不向翻译中添加任何标签。在这种情况下, 要对标签对格外小心,因为忘记删除成对标签中的一个的话将会破坏你的文档格式,这可能会导致一个已译的OpenOffice.org文档无法打开。
因为标签自己就被包含在文档中,因此无法使用 片段规则来创建包含更含更少标签的片段。这是入门用户不应该使用的高级功能。
OmegaT 目前还无法自动检测格式错误,因此如果犯了错误或者改变格式以更好适应你使用的目标语言时,它不会对你作任何提示。然而有时,这些错误会导致你翻译出的文件看起来不正常,如果是开放文档或者OpenOffice.org文件,甚至可能无法打开。