Corpora eleaniztunak

  1. Zergatik dira oso beharrezkoak (itzulpengintzatik begiratuta, batez ere)
  2. Itzulpen automatikoaren mugak
  3. Ze corpus eleaniztun mota dago?
  4. Internetek badu zerikusirik?
  5. Euskararako zer dago?
  6. Zein da biderik egokiena?

Testuartekotasuna eta itzulpengintza

Intertextuality concerns the factors which make the utilisation of one text dependent upon knowledge of one or more previously encountered texts. Beaugrande & Dressler (1981)

Because of intertextuality, readers could identify scientific texts and literary texts as different types of text. In other words, readers develop tacit expectations about the textual appearance of certain kind of text. Each text type has specific norms and readers have certain expectations for each type of text. Sung Hee Kirk (2000), Chodang University, Korea

Adibide bat: Aita Gurea eta Hamlet

     
Our Father, who art in heaven, hallowed be thy name; thy kingdom come; thy will be done; on earth as it is in heaven. Give us this day our daily bread. And forgive us our trespasses, as we forgive those who trespass against us. And lead us not into temptation; but deliver us from evil. For thine is the kingdom, the power and the glory, for ever and ever. Amen.
[metodista]
Padre nuestro, que estás en los cielos: santificado sea tu nombre. Venga a nosotros tu reino. Hágase tu voluntad, así en la tierra como en el cielo. Danos hoy nuestro pan de cada día. Y perdónanos nuestras deudas, así como nosotros perdonamos a nuestros deudores. Y no nos dejes caer en la tentación, mas líbranos del mal. Porque tuyo es el reino y la potencia y la gloria por los siglos de los siglos. Que ta volonté soit faite sur la terre comme au ciel. Donne-nous aujord´hui notre pain quotidien. Et pardonne-nous nos offenses, comme nous pardonnous à ceux qui nous ont offensés. Et ne nous induis point en tentation, mais délivre-nous du mal. Car c`est à toi qu´appartiennent le règne et la puissance et la gloire aux siècles des siècles. Notre père, qui es aux cieux: que ton nom soit sanctifié. Que ton règne vienne.
Hamlet Act III Scene iii    
And what's in prayer but this twofold force,
To be forestalled ere we come to fall,
Or pardon'd being down? Then I'll look up;
My fault is past.
¿Y qué hay en la oración, si no es la doble virtud
de precavernos para no caer
y de hacernos perdonar cuando caemos? Alcemos, pues la vista al cielo;
mi crimen se ha consumado ya.
  ¿Y qué hay en la oración sino esta doble fuerza:
ser estorbados antes de caer, o perdonados una vez caídos? Entonces levantaré la mirada
Mi culpa ha pasado.
 
  ¿Y qué hay en la oración sino el doble poder
de impedirnos obrar mal
o perdonarnos si caemos? Tendré ánimo.
El daño está hecho.
 

"The King James Version was originally written from 1607 to 1610." Smith, Wilbur M. The English Bible and its Development The Open Bible Thomas Nelson Pub. Nashville 1979 p.1251

"1601, the year Hamlet was written, was marked for Shakespeare by two highly significant events: the death of his father, and the imprisonment of his generous patron and friend, Lord Southampton, as a consequence of the failure of a rebellion led by Lord Essex, whose lieutenant he was."


Internet and Shakespeare

Google

eXist

http://exist-db.org

eXist es una base de datos en XML nativo de código abierto que ofrece procesamiento de preguntas meidante XPath, con extensiones para búsquedas de palabras clave.

Ejemplos:


Itzulpen automatikoaren mugak

Ikasleek egindako azterketak:

Memorandum of Association vs Escritura de Constitución de Sociedad

(18 paragraphs vs 2)

Objectives definition in a Memorandum of Association for a British company  Equivalent definition in an Spanish Escritura de Constitución de Sociedad
The Company's objectives are

(B) To carry on any other trade or business which can, in the opinion of the Board of Directors, be advantageously carried on by the Company in connection with or as ancillary to any of the above businesses of the general business of the Company.

(C) To purchase, take on lease or in exchange, hire or otherwise acquire and hold for any estate or interest any lands, buildings, easements, rights, privileges, concessions, patents, patent, rights, licenses, secret, processes, machinery, plant, stock-in-trade, and any real or personal property of any kind necessary or convenient for the purpose of or in connection with the Company's business or any branch or department thereof.

...

(S) To do all such other things as are incidental or conductive to the above objects or any of them.

La sociedad tendrá por objeto el cultivo, comercialización, explotación y distribución de productos hortofrutícolas de cualquier género. Las actividades de comercialización, explotación y distribución podrán ser realizadas, igualmente, previa la adquisición a terceros de los productos referidos o de las patentes necesarias para el cultivo de los mismos.

Las actividades citadas en los dos párrafos anteriores podrán ser desarrolladas por la Sociedad mediante la titularidad de acciones o participaciones en otras sociedades con idéntico o análogo objeto social.


Corpus eleaniztunen motak


ATeus: analogiak eta erregelak

Boletines Oficiales / Aldizkari Ofizialak
BAO (± 80Mb)
GAO (± 20Mb)
Años 1996-2000

Datos cuantitativos
823.368 elementos alineados (párrafos, oraciones, etc.)
447.746 elementos repetidos
277.712 palabras (± 50.000 lexemas)
± 20% entidades con nombre propio: pers, org, doc, top, etc.
342.492 segmentos (fórmulas, plantillas, términos de especialidad)
2 a 30 variantes (en la traducción)
± 20 categorías textuales (géneros)
“Cuando exista una diferencia de altura entre las rasantes del perímetro del edificio tal que permita iluminar o dar acceso independiente a locales de semisótano, éstos contabilizarán en el cómputo de la superficie construida en una proporción igual a la relación entre la superficie de su fachada sobre rasante respecto a la superficie de su cerramiento perimetral, se halle enterrado o no, computado desde el plano horizontal definido por la rasante de menos cota.” “Eraikinaren perimetroko sestren artean, erdisotoko lokalak argitu edo aparteko sarbidea emateko bestekoa den altuerako tarte bat dagoenean, hauek, eraikitako azaleraren konputuan kontabilizatuko dira, sestraren gaineko euren fatxadaren azaleraren pareko proportzioan, perimetrozko euren zarraketaren azalerari dagokionean, hau lurraren azpian hala gainean dagoela, kotarik txikiena duen sestrak definitutako plano horizontaletik konputatua.” “Eraikinaren perimetroko sestren arteko altuera diferentzia dagoenean, eta diferentzia horrek erdisotoko lokalak argitu edo horiei sarbide independientea ematen badie, horiek azalera eraikian kontabilizatuko dira, sestra gaineko fatxadaren azaleraren eta perimetroko itxiduraren azaleraren arteko erlazioaren proportzio berean, itxidura hori lurperaturik egon ala ez, eta kota txikieneko sestrak definituriko plano horizontaletik konputaturik.”
  “Eraikinaren perimetroaren sestren arteko altueran, erdisotoko lokalak argitzea edo sarrera bananduak ahalbideratzeko aldea dagoenean, hauek eraikitako azaleraren zenbatekoan sartuko dira, bere sestraren gaineko fatxadaren azalera bere itxitura perimetralaren azalerarekiko proportzio batean, lurperaturik egon edo ez, eta kota txikienak definituriko plano horizontaletik zenbatua.” “Eraikinaren perimetroko lerrokaduren artean dagoen altuera-diferentziak erdisotoak argitzeko edo bertako lokaletara sartzeko modua ematen badu, erdisoto horiek eraikitako azaleraren konputoan sartuko dira, eta sartu ere sestra gainean duten fatxadaren azaleraren eta perimetroaren -zorupekoa zein ez- azaleraren arteko proportzio berean sartuko da.”

Aldaeren adibide gehiago


MATXIN:IXA


SARE-Bi: Dokumentu eleaniztunak kudeatzeko sistema

http://www.deli.deusto.es/SareBi


Corpora eta metadata

TMX: adibidea

TEI: adibidea


<?xml version="1.0" encoding="iso-8859-1"?>
<!DOCTYPE TEI.2 SYSTEM "teixlite.dtd">
<TEI.2>
 <teiHeader>
  <fileDesc>
   <titleStmt>
    <title>Reunión de Departamento</title>
    <author>Director de Departamento de Filología 
Inglesa</author>
    <funder>Proyecto PI1999-72, Gobierno Vasco</funder>
    <principal>Proyecto XML-Bi; grupo DELi</principal>
   </titleStmt>
   <publicationStmt>
    <publisher>Universidad de Deusto</publisher>
    <availability><p>Uso interno. Universidad de 
Deusto</p></availability>
   </publicationStmt>
   <notesStmt>
    <note type="validated" resp="REDACTOR">No</note>
   </notesStmt>
    </fileDesc>
  <encodingDesc>
   <projectDesc>XML-Bi</projectDesc>
   <classDecl>
    <taxonomy id="DELi_SareBi_Tipologia_4">
     <bibl>http://www.deli.deusto.es/AboutUs/Projects/XML-
Bi/Admin/XML-Bi_I2_an1_tipologia4.txt</bibl>
    </taxonomy>
   </classDecl>
  </encodingDesc>
  <profileDesc>
   <creation><date>2003/04/14 16:40:49.366 
GMT+2</date></creation>
   <langUsage>
    <language id="es">español</language>
   </langUsage>
   <textClass>
    <classCode 
scheme="DELi_SareBi_Tipologia_4">21504</classCode>
   </textClass>
  </profileDesc>
 </teiHeader>
 <text>
  <front>
   <docDate>1999/06/23</docDate>
   <docAuthor>Director de Departamento de Filología 
Inglesa</docAuthor>
   <head type="place">Bilbao</head>
   <head type="DepSup">1400</head>
   <head type="DepInf">1406</head>
  </front>
  <body> ...  </body>
 </text>
</TEI.2>

OAI: adibidea

<header>
    <identifier>oai:arXiv.org:cs/0112017</identifier>
    <datestamp>2002-02-28</datestamp>
    <setSpec>cs</setSpec>
    <setSpec>math</setSpec>
</header>
<metadata>
 <oai_dc:dc 
     xmlns:oai_dc="http://www.openarchives.org/OAI/2.0/oai_dc/" 
     xmlns:dc="http://purl.org/dc/elements/1.1/" 
     xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance" 
     xsi:schemaLocation="http://www.openarchives.org/OAI/2.0/oai_dc/ 
     http://www.openarchives.org/OAI/2.0/oai_dc.xsd">
   <dc:title>Using Structural Metadata to Localize Experience of Digital 
             Content</dc:title>
   <dc:creator>Dushay, Naomi</dc:creator>
   <dc:subject>Digital Libraries</dc:subject>
   <dc:description>With the increasing technical sophistication of both 
    information consumers and providers, there is increasing demand for 
    more meaningful experiences of digital information. We present a 
    framework that separates digital object experience, or rendering, 
    from digital object storage and manipulation, so the
    rendering can be tailored to particular communities of users. 
   </dc:description>
   <dc:description>Comment: 23 pages including 2 appendices, 
                   8 figures</dc:description>
   <dc:date>2001-12-14</dc:date>
   <dc:type>e-print</dc:type>
   <dc:identifier>http://arXiv.org/abs/cs/0112017</dc:identifier>
 </oai_dc:dc>
</metadata>
<about> 
 <provenance
     xmlns="http://www.openarchives.org/OAI/2.0/provenance" 
     xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance" 
     xsi:schemaLocation="http://www.openarchives.org/OAI/2.0/provenance
     http://www.openarchives.org/OAI/2.0/provenance.xsd">
    <originDescription harvestDate="2002-02-02T14:10:02Z" altered="true">
      <baseURL>http://the.oa.org</baseURL>
      <identifier>oai:r2.org:klik001</identifier>
      <datestamp>2002-01-01</datestamp>
      <metadataNamespace>http://www.openarchives.org/OAI/2.0/oai_dc/</metadataNamespace>
    </originDescription>
  </provenance>
</about>

DELi taldea, 2003ko ekaina.