OASIS XML Localisation Interchange File Format (XLIFF) TC

RE: [xliff][follow-up] FW: Degrees of constraint

  • 1.  RE: [xliff][follow-up] FW: Degrees of constraint

    Posted 07-28-2004 08:28
     MHonArc v2.5.0b2 -->
    
    
    
    
    
    
    
    
    
    
    
    
    
    
    
    
    

    xliff message

    [Date Prev] | [Thread Prev] | [Thread Next] | [Date Next] -- [Date Index] | [Thread Index] | [List Home]


    Subject: RE: [xliff][follow-up] FW: Degrees of constraint


    Hi there,

     

    Since the discussion for intra-source/intra-target extension points revolves around terminology-/linguistics related examples, and since we are touching this area also in other contexts, here a couple of thoughts about the representation of terminology-/linguistics related information ...

     

    I would favor an approach which some might term 'normalized' (in the sense of database theory), others 'single source-oriented/non-redundant'. It boils down to the following:

     

    If you have chunks of information (e.g. all information related to a terminology concept) than don't repeat it, rather link to it. Accordingly, Yves' example would be become:

     

    <source>Our guests can appease their spirit of adventure and itchy

    feet by exploring the various islands of our small� <xyz:term cID="1234ABE34FE">>archipelago</xyz:term></source>.

     

    'cID' abbreviates 'concept identifier'.

     

    The identifier would be related to terminological database which is identified by the URN to which the namespace prefix belongs.

     

    An XML serialization of the concept identified by 'cID' would look like the following:

     

    <xyz:termEntry cID="1234ABE34FE">

    �<xyz:term>archipelago</xyz:term>

    �<xyz:pos>noun</xyz:pos>

    �<xyz:info>

    � <xyz:def>Group of island<xyz:def>

    � <xyz:pronunciation>"�r-k&-'pe-l&-"gO, "�r-ch&-<xyz:pronunciation>

    �</xyz:info>

    </xyz:termEntry>

     

     

    Using the Open Lexicon Interchange Format (OLIF; see http://www.olif.net) as the representation for the XML serialization, you could end up with XLIFF which looks like the following:

     

     

    <xliff version="1.1" xmlns="urn:oasis:names:tc:xliff:document:1.1" xmlns:xyz="urn:appInfo:Items" xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance" xmlns:olf="http://www.olif.net/base/sampleDatabase" >

    ������ <file original="island.txt" source-language="en" target-language="fr" datatype="plaintext">

    ������������ <header>

    ������������������� <glossary>

    �������������������������� <internal-file>

    �������������������������������� <olif OlifVersion="2.0, February 2002">

    ��������������������������������������� <header CreaTool="CoolTerm" CreatToolVersion="1.4.3" OrigFormat="internal" AdminLang="EN" CreaDate="20031119091301Z" CreaId="X">

    ���������������������������������������������� <dataCatReg>

    ���������������������������������������������������� <subjFieldDCS DCSType="replacement">CompLingCompany</subjFieldDCS>

    ���������������������������������������������� </dataCatReg>

    ���������������������������������������������� <contentInfo>

    ���������������������������������������������������� <quotMarkInfo QuotMarkRet="some"/>

    ���������������������������������������������������� <langIdUse>region_exception</langIdUse>

    ���������������������������������������������� </contentInfo>

    ��������������������������������������� </header>

    ��������������������������������������� <body>

    ���������������������������������������������� <entry ConceptUserId="2312">

    ���������������������������������������������������� <mono MonoUserId="1232">

    ����������������������������������������������������������� <keyDC>

    ������������������������������������������������������������������ <canForm>archipelago</canForm>

    ������������������������������������������������������������������ <language>en</language>

    ������������������������������������������������������������������ <ptOfSpeech>noun</ptOfSpeech>

    ������������������������������������������������������������������ <subjField>general-naturalScience-geography</subjField>

    ����������������������������������������������������������� </keyDC>

    ����������������������������������������������������������� <monoDC>

    ������������������������������������������������������������������ <monoSem>

    ������������������������������������������������������������������������ <definition>Group of islands</definition>

    ������������������������������������������������������������������ </monoSem>

    ����������������������������������������������������������� </monoDC>

    ����������������������������������������������������������� <generalDC>

    ������������������������������������������������������������������ <note>pron:"�r-k&amp;-'pe-l&amp;-"gO, "�r-ch&amp;-</note>

    ����������������������������������������������������������� </generalDC>

    ���������������������������������������������������� </mono>

    ���������������������������������������������� </entry>

    ��������������������������������������� </body>

    �������������������������������� </olif>

    �������������������������� </internal-file>

    ������������������� </glossary>

    ������������ </header>

    ������������ <body>

    ������������������� <trans-unit id="x">

    �������������������������� <source>Our guests can appease their spirit of adventure and itchy

    feet by exploring the various islands of our small� <olf:term cID="2312">archipelago</olf:term>

    �������������������������� </source>.

    �� <target>Notre visiteurs ...</target>

    ������������������� </trans-unit>

    ������������ </body>

    ������ </file>

    </xliff>

     

    The benefits of this ‘link-only’ approach would clearly start to show if you for example would have the term ‘archipelago’ 1000 times in your document …

     

    Best regards,

    Christian