Itzulpengintza automatikoari sarrera: 2 - 4

3 Aipamen historikoa

Makina itzultzaileak egiteko nahia ordenagailuak izan baino askoz ere lehenagokoa da. Hortaz, berrogeigarren hamarkadan ordenagailu bat eskura egon zenetik, itzulpen automatikoa berehala bilakatu zen informatikaren aplikapenik arrakastatsuenetakoa. Ordutik hona, astia izan da anitz esperimentu egiteko, txikiak eta handiak, bai eta instituzio zein industria mailako inbertsio handiak ere. Itzulpen automatikoaren garapena era zehatzago batean ezagutzeko, John Hutchins britainiar akademikoa ezinbesteko erreferentzia da, zorionez, arazorik gabe kontsulta daiteke interneten. IAren aipamen labur honetan Johnatan Slocum-en eskema laburtua segituko dugu, IAren historia hamarkadak erreferentzia gisa hartuz azaltzen duena. Berak aipatzen dituen 1985 arteko lau hamarkadei guk beste bi gehituko dizkiegu.

Sei hamarkada

1.hamarkada: Lehendabiziko aurrerapen informatiko aipagarriak ENIAC ordenagailu ospetsuan egin ziren 1946an. Ikerlari aitzindarien artean Warren Weaver, Rockefeller Fundaziokoa, aipatu beharra dago. Bera izan zen diziplinaren berri eman zuena izan zitezkeen diziplina hori aplikatzeko metodo zientifikoak aurreratuz: teknika kriptografikoen erabilera, Shannon-en teoremen aplikapena eta estatistikaren erabilgarritasuna, baita gizakion hizkuntzaren azpiko logika eta antza dituen ezaugarri unibertsalak aprobetxatzeko aukera ere. Munduan gerra bat amaitzen ari zen, orduan maila zientifikoan mezu ezkutuak argitzeko metodo konputazionalen garapena sustatu zuen mundu gerra. Weaverrek esan omen zuen "errusieraz idatzitako artikulu bat ikusten dudanean neure buruari esaten diot, hori ingelesez idatzita dagoela, baina ikur berezien bidez kodifikaturik. Deskodifika dezagun oraintxe bertan!" (Barr eta Feigenbaum-ek aipatua, 1981). Zertan esanik ez dago orduan oso arruntak zirela ordenagailuak eta programatzeko teknikak (tableroen kable multzoaren bidez makina lengoaian programatzen zen), eta hori zela kausa metodoak frogatzeko aukera errealak oso gutxi ziren.

2.hamarkada: 1951n Massachussetts-eko Teknologia Institutuak (MTI) bere adituetako bat, Yehoshua Bar-Hillel, soilik IAan aritzeko dedikazio esklusiboa eman zion. Urtebete geroago IAren lehenengo sinposioa antolatu zen hizkera kontrolatuak, azpi-hizketak, sintaxiaren beharra, edo gizakion esku hartzerik gabe aritzeko aukera bezalako gaiekin. Itzultzaile automatiko baten lehendabiziko agerpen publikoa 1954an izan zen Georgetown-eko Unibertsitatean, IBM-en laguntza eta Leon Dostert ikerlariaren parte hartzearekin. Kontu handiz errusieraz zeuden 48 perpausa aukeratu eta ingelerara itzuli 250 hitzetako hiztegia eta 6 erregela gramatikalen bidez. Erakustaldiaren arrakasta baldintzatua nabarmena izan zen eta AEBetan aurrekontuen partida garrantzitsuak (gehienak Defentsa Ministerioak emanda) egon ziren errusiera, frantses eta alemaneratik itzulpenak egiteko. Hasierako euforia unea izan zen "fully automatic high quality translation" (FAHQT) delakoaren helburua planteatzea eragin zuena. Hamarkada hartako garapen aitzindarien artean Georgetown eta Texas unibertsitateetakoak azpimarratu behar da, bertan egun oraindik diren sistema biren oinarriak ezarri ziren, "SYSTRAN" eta "METAL" hurrenez hurren.

3.hamarkada: Hala eta guztiz ere, hasierako inbertsio handi haiek ez zuten espero zen emaitza ematen. Bar-Hillel-ek 1960an FAHQT-aren ideia zalantzatan jartzen ausartu zen esanez, gizakiak eginiko itzulpenetan lortutako emaitzekin alderatu ahal izateko oraindik ezin lor daitezkeen ezagutza semantiko eta pragmatikoa gehitu beharra legokeela, hortaz, helburu gutxiago izateko aholkua eman zuen. 1964an "National Research Council-ak" ALPAC izeneko komitea eratu zuen ("Automatic Language Processing Advisory Committee") IAren egoera baloratzeko. Bi urte beranduago argitaratu ziren emaitzek ondorio larriak izan zituzten: "…ez da itzulpen automatikorik lortu testu zientifiko orokorretarako, eta ez dirudi epe laburrean lortuko denik". Emaitzak diru iturrien mozketa ikaragarri batean amaitu zuen, literalki AEBetako ikerketekin bukatu zuena. Edozelan ere, teoria mailan aurrerapen handiak izan ziren garaia izan zen. Noan Chomsky-k hizkuntzen azterketan iraultza sortu zuen "Syntactic Structures" bere lana argitaratzean 1957an. Informatikari dagokionez, maila altuko programazio datu eta hizketa egituren diseinu berriek (ALGOL, LISP) algoritmo eta modulu metodologien garapena ekarri zuten, diziplinaren bilakaeran funtsezkoak izan zirenak hain zuzen.

4.hamarkada: ALPAC txostenak erabat kaltetu zuen IA AEBetan, baina Kanada eta Europan ez zuen apenas eraginik izan. 1976an TAUM taldeko ikerlariek ("Traduction Automatique de l'Université de Montréal") "MÉTÉO" sistema aurkeztu zuten, metereologi parteak ingelesetik frantsesera itzultzen zituena. Historia egin duen sistema da aplikapena eta diseinuaren egokitasunagatik. Urte hartan bertan EB-k IAra jotzea erabaki zuen administrazio egoitza ezberdinetan zuten itzulpen eskaeren hazkunde itzelari aurre egiteko asmoz. Komisioak SYSTRAN garatu eta zituzten beharretara egokitzeko lizentziak erosi zituen. Geroxeago, Europan ikerketa sustatu eta itzulpenen kalitatea hobetzeko ideiarekin, Komisioak berak "EUROTRA" proiektu handizalea finantzatu zuen. Laurogeiko hamarkada osoa hartu zuen garai hura metodo sinbolikoen garapena eta sintaxi (ezaugarriak bateratzean oinarrituriko gramatikak) eta semantika mailako (predikatuen logikan oinarrituriko formalismoa) ikerketaren bizitasun handia izan zuen ezaugarri nagusi. Halere, teoria mailan eginiko aurrerapenak ez ziren emaitzetara ailegatzen.

5.hamarkada: Dudarik gabe 1991n EB-k agindu zuen Danzin txostenaren emaitzekin lotuta, Europan IArekin zerikusia zuten berri txar bi egon ziren. Instituzioei dagokionez, EB-k EUROTRArako finantzazioa bertan behera uztea erabaki zuen; enpresen aldetik, PHILIPS-ek ustekabean amaitutzat eman zuen adituen artean prestigiorik gehien zuen proiektuetako bat, "ROSETTA". Une horretan bertan Japonen aurreko urteetako inbertsio onen ostean aurrekontuen politika zuhurrago bat aplikatu zen. Beherakada orokorraren Testuinguru horretan itzulpen lagunduaren produktu mota bat azaldu zen merkatura, aurrekoen oso bestelako diseinua zuena. Itzulpen memorien kudeaketa programak ziren, hasiera batean IBM-k ("Translation Manager") eman zuen ezagutzera eta geroago publikora atera zituzten alemaniako TRADOS enpresek ("Translator´s Workbench") eta STAR ("TRANSIT"), eta Espainiako ATRIL ("DÉJÀ-VU"). Azpimarra daitekeen garai hartako beste alderdi bat Internet-aren garapena da itzulpenaren ikuspegitik lokalizatzearen ikuspegirako aldaketarekin batera.

6.hamarkada: Gaur egun etapa berri baten hasieran gaude. Enpresa eta merkatuen globalizazioarekin batera produktuek eta zerbitzuek "tokian tokiko" egokitzapena izatea dator. Iraganaren jazarle, teknologia asko arkitektura hibridoetan sartzen eta osatzen ari dira, itzulpena orain benetan elektronikoa den informazioaren ziklo konplexuaren beste maila bat bailitzan ulertzen dute. Garapen hauen guztien leitmotiv deiturikoa Internet da oraindik ezin aurrera ditzakegun inplikazioekin, baina neurri handi batean jabego intelektuala eta pilatzen ari diren hizkuntza baliabide ustiaketaren eskubideak argituko diren moduaren menpe daudenak.

Metodologi garapena

Itzulpen automatikoari aplikaturiko metodoak bi talde handitan bana ditzakegu:

Ikuspuntu teorikotik erabat kontrajarririk dauden hurbilpenak dira, diseinu sistema oso ezberdinak sortarazten dituztenak. Arauetan oinarrituriko sistemek euren kontzepzio teorikoan, Hizkuntzalaritza Sortzailean eta Adimen Artifizialean izandako aurrerapenen eragina izan dute, batez ere, 1970eko hamarkadatik aurrera. Sistema hauek dira normalean "itzulpen automatikorako" benetako sistematzat hartzen direnak. Analogietan oinarrituriko sistemak 1990eko hamarkadan agertu dira eta hurbilpen estatistikoen metodoak aplikatzen dituzte aldez aurretik itzulita dauden testu zatien gainean. Ele egitea eta Corpus Hizkuntzalaritza aztertzeko sistemetan erabilitako tekniken antzekoak aplikatzen dituzte. Zenbait autoreren ustetan "itzulpen lagunduaren" sistemak dira.

Laurogeita hamarreko hamarkada arte ikerlarien artean izan den premisarik indartsuenetako bat, itzulpena funtsean parekotasun semantikoaren arazo gisa hartzea izan da. Premisa horren oinarria Leibniz-en garairaino heldu eta Frege eta Montague-k, semantika garaikidearen aitak, hartu zuten ustean dago, alegia, munduko hizkuntza guztiek azpiegitura logiko bera dutela. Horrela izatekotan, azpiegitura hori asmatu eta formalizatzeko gai bagina itzulpenaren arazoa konponduta legoke. Ideia horrekin, ikertzaileak parekotasun kontzeptualaren arazoa konpontzen saiatu dira, bai adierazpen neutro eta komunen bitartez - hizkuntz arteko teknika -, bai hizkuntza bikoteen artean tarteko adierazpenak proiektatuz -transferentzia teknika. Semantikaren tratamendu konputazionalerako gehien erabiltzen diren ereduen artean azpimarratzeko dira honako hauek: sare semantikoak (Simmons eta Slocum, 1972), lehentasun semantikoak (Wilks, 1973), kasu eta balentzia gramatikak (Somers, 1987), adierazpen kontzeptualak (Carbonell et al, 1981; Nirenburg et al, 1985), transferentzia lexikoa (Melby, 1988; Alonso, 1990), semantika lexikoa (Dorr, 1993) eta ez-anbiguotasun lexikoa (Masterman, 1957; Amsler eta White, 1979).

Uste teoriko hori seguruenik itzultzaileentzat itzulpen sistema erabilgarrien garapena gehien kaltetu duen alderdia da. Duela gutxi arte, soilik behatzaile autorizatu batzuek Melby (1995) edo Kay (1997) esaterako, ausartu dira kritikak egiten. Melby izan da hizkuntzen arteko unibertsaltasun kontzeptualaren hipotesia era argi batean zalantzetan jarri duen lehena. Itzultzaile profesionalek zalantzetan jarri dute ideia horren baliagarritasuna Interneteko (Lantra-1) foro ezagunetan islatzen den legez. Horretaz gain, itzulpengintzaren esparruan semantikoa bezain garrantzitsuak diren parekotasun mailak deskribatzen dituzten azterketa berriak dira. Nord-ek (1993), itzulpen parekotasunaren azterketan egilerik nabarmenena den emakumek, bi dimentsio gehiago proposatzen ditu, parekotasun estatistikoa eta parekotasun pragmatikoa. Bestalde, Hatim eta Mason-ek (1990), itzulpena soilik linguistikoa baino, batez ere zentzu pragmatikodun kontutzat hartzearen garrantzia azpimarratzen dute, eta parekotasun abstraktuagoa duen maila proposatzen dute sinbolo sozial eta kulturalen eremuan, hots, semiotikarena.

Birpasa ditzagun astiroago itzulpen automatikoan erabilitako metodoen multzo biak kontuan hartuz azpi-motarik erabilienak.


Joseba Abaitua, 2002ko urtarrila Itzulpengintza automatikoari sarrera: 2 - 4