Memòria de tradutzione

Dae Wikipedia, s'entziclopedia lìbera.

Una memòria de tradutzione (MT o TM) est una base de datos chi archìviat "segmentos", chi podent èssere fràsias, paràgrafos o unidades chi assimìgiant a fràsias (intestatziones, tìtulos o elementos in una lista) chi sunt istados giai bortados, pro agiudare sos tradutores umanos. Sa memòria de tradutzione archìviat su testu de orìgine e sa tradutzione chi li currispondet in crobas de limbas mutidas "unidades de tradutzione". Sas paràulas sìngulas benint tratadas dae sas bases de terminologia e non sunt parte de su domìniu de sas memòrias de tradutzione.

Sos programmas informàticos chi impreant memòrias de tradutzione sunt connotos a bortas comente gestores de memòrias de tradutzione (TMM) o sistemas de memòrias de tradutzione (in inglesu TM systems, de non confùndere cun unu sistema de gestione de tradutziones (TMS), chi est un'àtera casta de programma chi s'òcupat de gestire sos protzessos de tradutzione.

Sas memòrias de tradutzione de sòlitu s'impreant paris a un'aina de tradutzione assistida dae s'elaboradore (CAT), a unu programma de elaboratzione de testos, a sos sistemas de gestione de sa terminologia, a unu ditzionàriu a prus limbas, o fintzas cun un'essida ruza de tradutzione automàtica.

Sas chircas nos faghent ischire chi medas aziendas chi sunt produende documentatziones a prus limbas sunt impreende sistemas de memòrias de tradutzione. In unu sondàgiu intre sos professionistas in su 2006, su 82.5% de sas 874 rispostas at cunfirmadu s'impreu de una memòria de tradutzione.[1] S'impreu de memòrias de tradutzione fiat ligadu a sa casta de testu caraterizadu dae tèrmines tècnicos e istrutura simpre de sas fràsias (tècnicas, unu pagu de mancu ligadas a su limbàgiu cummertziale e finantziàriu) a sas capatzidades informàticas e a sa ripetitividade de sos cuntenutos.[1]

Impreu de sas memòrias de tradutzione[modìfica | modìfica su còdighe de orìgine]

Su programma truncat su testu de orìgine (su testu de bortare) in segmentos, chircat currispondèntzias intre sos segmentos e sa metade de orìgine de sas crobas orìgine-tradutzione giai bortadas chi s'agatant in una memòria de tradutzione, e presentat custas crobas chi currispondent comente candidados pro sa tradutzione. Su tradutore podet atzetare unu candidadu, lu podet sostituire cun una tradutzione noa, o lu podet modificare pro lu fàghere currispòndere cun su testu de orìgine. In sos ùrtimos duos casos sa tradutzione noa o modificada s'annanghet a sa base de datos.

Unos cantos sistemas de memòrias de tradutzione chircant petzi pro currispondèntzias de su 100%, est a nàrrere chi podent recuperare petzi segmentos de testu chi currispondent in manera esata a intradas in sa base de datos, cando chi àteros impreant algoritmos de currispondèntzia isfocada pro recuperare segmentos simigiantes, chi benint presentados a su tradutore cun sas diferèntzias marcadas. Est de importu mannu a dare cara a su fatu chi sos sistemas de memòrias de tradutziones tìpicos chircant testu petzi in su segmentu de orìgine.

Sa flessibilidade e sa robustesa de s'algoritmu de currispondèntzia determinant in parte manna su rendimentu de sa memòria de tradutzione, fintzas si pro unas cantas aplicatziones su tassu de agatamentu de currispondèntzias esatas podet èssere artu bastante pro giustificare sa modalidade de currispondèntzia a su 100%.

Sos segmentos chi non tenent currispondèntzias los at a dèpere bortare su tradutore in manera manuale. Custos segmentos bortados noos benint sarvados in sa base de datos in ue si podent impreare pro tradutziones benidoras o fintzas pro ripetitziones de cussu segmentu in su testu currente.

Sas memòrias de tradutzione funtzionant mègius in testos chi sunt ripetitivos meda, che a sos manuales tècnicos. Sunt de agiudu fintzas pro bortare modìficas incrementales in unu documentu giai bortadu chi currispondent, pro fàghere un'esempru, a modìficas minores in una versione noa de unu manuale de impreu. In su protzessu traditzionale sas memòrias de tradutzione non sunt istadas cunsideradas apropriadas pro testos literàrios o creativos, ca b'est pagu ripetitzione a beru in su limbàgiu impreadu. Nointames custu, àteros las cunsìderant de giudu fintzas pro testos non ripetitivos, ca sas resursas de sas bases de datos creadas tenent giudu pro chircas de currispondèntzia pro determinare s'impreu apropiadu de tèrmines, pro sa verìfica de sa calidade (perunu segmentu bòidu) e pro sa semplificatzione de su protzessu de revisione (sos segmentos de orìgine e de destinatzione sunt semper ammustrados paris cando chi sos tradutores tenent de traballare cun duos documentos in un'ambiente de revisione traditzionale.

Avantàgios printzipales[modìfica | modìfica su còdighe de orìgine]

Sos gestores de memòrias de tradutzione sunt adatos mescamente pro bortare documentatzione tècnica e documentos chi cuntenent vocabulàrios ispetzializados. Sos avantàgios issoro incluent:

  • Garantire chi su documentu siat bortadu de su totu (sas memòrias de tradutzione no atzetant segmentos de destinatzione bòidos)
  • Garantire chi sos documentos bortados siant cunsistentes, incluende sas definitziones, sas frases e sa terminologia comunes. Custu est de importu cando tradutores diferentes sunt traballende a unu progetu sìngulu.
  • Permìtere a sos tradutores de bortare documentos in una variedade manna de formados chene dèpere possedere su programma chi de sòlitu est netzessàriu pro protzessare custos formados.
  • Allestrare su protzessu generale de tradutzione; essende chi sas memòrias de tradutzione "ammentant" su materiale giai traduidu, sos tradutores lu depent bortare una borta ebbia.
  • Minimare sos costos de sos progetos de tradutzione a tèrmine longu; a esèmpiu tocat a bortare su testu de manuales, messàgios de avisu o sèries de documentos una borta ebbia e si podent impreare bortas medas.
  • Pro progetos mannos de documentatzione sos rispàrmios (in tempus o dinare) gràtzias a s'impreu de unu pachete de memòria de tradutzione diant pòdere èssere craros giai dae sa prima tradutzione de unu progetu nou, ma de sòlitu custos rispàrmios si notant petzi bortende versiones imbenientes de unu progetu chi fiat giai bortadu in antis de s'impreu de sa memòria de tradutzione.

Ostàculos printzipales[modìfica | modìfica su còdighe de orìgine]

Sos problemas printzipales chi tropellant un'impreu prus ispainadu de sos gestores de memòrias de tradutzione sunt:

  • Su cuntzetu de "memòrias de tradutzione" est basadu subra s'idea chi sas fràsias impreadas in tradutziones antepostas si potzant "ritziclare". Però, unu printzìpiu chi ghiat sa tradutzione est su chi su tradutore depat bortare su messàgiu de su testu, e non sas fràsias chi lu cumponent.
  • Sos gestores de memòrias de tradutzione non s'ìntegrant in manera fàtzile in protzessos de tradutzione o de localizatzione chi sunt giai in cursu. Pro isfrutare comente si tocat sa tecnologia de sas memòrias de tradutzione tocat a torrare a progetare su protzessu de tradutzione.
  • Sos gestores de memòrias de tradutzione non suportant, a dies de oe, totu sos formados de documentatzione, e sos filtros pro suportare totu sas castas de archìvios diant pòdere no esistire.
  • B'est una curva de imparu assotziada cun s'impreu de sos gestores de memòrias de tradutzione, e sos programmas si depent personalizare pro una resa prus manna.
  • In sos casos in ue parte de su protzessu de tradutzione siat esternalizadu o gestidu dae tradutores indipendentes chi non traballant in sede, sos traballadores indipendentes tenent bisòngiu de ainas ispetziales pro pòdere traballare cun sos testos generados dae su gestore de memòrias de tradutzione.
  • Sas versiones intras de medas gestores de memòrias de tradutzione podent costare dae 500$ a 2'500$ pro postatzione, cosa chi podet rapresentare un'investimentu de annotu (fintzas si bi sunt fintzas àteros programmas prus baratos a disponimentu). Nointames custu, unos cantos isvilupadores produint versiones a indonu o baratas de sas ainas issoro cun listas de funtzionalidades minimadas chi sos tradutores individuales podent impreare pro traballare a progetos impostados cun versiones intreas de cussas ainas. (B'at de tènnere in contu chi bi sunt pachetes de gestores de MT lìberos e de badas a disponimentu, ma nissunu de custos at galu otènnidu una parte manna de mercadu.)
  • Fintzas sos costos ligados a s'importatzione de sas tradutziones betzas de s'utente in sa base de datos de sa memòria de tradutzione, s'annestru, e fintzas cale si siat produtu additzionale diant pòdere rapresentare un'investimentu mannu.
  • Sa manutentzione de sas bases de datos de tradutzione tendet galu a èssere unu protzessu manuale in sa parte manna de sos casos, e su fallimentu de las manutèntare podet causare un'usabilidade e una calidade de sas currispondèntzias de sas memòrias de tradutzione minimadas.
  • Comente giai naradu, sos gestores de memòrias de tradutzione diant pòdere no èssere adatos pro testos chi non tenent una ripetitzione interna o chi non cuntenent partes non mudadas dae una revisione a s'àtera. Sos testos tècnicos sunt in gènere sos prus adatos pro una memòria de tradutzione, cando chi imbetzes los sunt de mancu sos testos publitzitàrios o creativos.

Efetos subra de sa calidade[modìfica | modìfica su còdighe de orìgine]

S'impreu de memòrias de tradutzione diat pòdere tènnere un'efetu in sa calidade de sos testos bortados. S'efetu printzipale est in manera crara ligadu a su chi sa chi si mutit "propagatzione de errore": si sa tradutzione pro unu segmentu particulare est isballiada, est prus probàbile chi sa tradutzione isballiada s'at a impreare sa borta imbeniente chi s'at a bortare su matessi testu de orìgine, o unu testu de orìgine chi l'assimìgiat, ispainende duncas sa faddina. Traditzionalmente sunt istados descritos duos efetos printzipales subra de sa calidade de sos testos bortados: s'efetu "insalada de fràsias" (Bédard 2000; tzitadu in O’Hagan 2009: 50) e s'efetu "ispiontzinu" (Heyn 1998). Su primu si riferit a una manàntzia de coerèntzia a livellu de testu cando unu testu benit bortadu dae una memòria de tradutzione chi est istada bortada dae tradutores diferentes cun istiles diferentes. A su chi narat s'ùrtimu, sos tradutores podent adatare s'istile issoro a s0impreu de unu sistema de memòrias de tradutzione pro fàghere in manera chi non cuntèngiant riferimentos intra-testuales, in manera chi sos segmentos si potzant torrare a impreare de prus in sos testos imbenientes, influentzende·ndesa coesione e sa leghibilidade. (O'Hagan 2009).

B'at un'efetu potentziale e, cando b'est, incònsciu in su testu bortadu. Limbas diferentes impreant secuèntzias diferentes pro sos elementos lògicos a intro de una fràsia e unu tradutore chi s'agatat a traballare cun una fràsias a prus clàusolas chi est mesu bortada est prus pagu probàbile chi l'at a torrare a fraigare de su tocu. Evidèntzias empìricas coerentes (Martín-Mor 2011) ammustrant chi est meda probàbile chi sos tradutores modifichent s'istrutura de una fràsia a clàusolas mùltiplas cando traballant cun un'elaboradore de testos in logu de unu sistema de memòrias de tradutzione.

B'est fintzas sa possibilidade pro unu tradutore de afrontare su testu in manera mecànica, fràsia cun fràsia, in logu de si cuntzentrare in subra de comente cada fràsia si relatzionat cun cussas a inghìriu e cun su testu in generale. Sos chircadores (Dragsted 2004) ant identificadu custu efetu, chi si relatzionat cun sa funtzionalidade de segmentatzione automàtica de custos progarammas, ma non est naradu chi tèngiat in automàticu un'efetu negativu subra de sa calidade de sas tradutziones.

B'at de notare chi custos efetos cunt ligados meda a s'annestru prus chi non a su traste. A su chi at iscritu Martín-Mor (2011), s'impreu de sistemas de meòrias de tradutzione tenent un'efetu subra de sa calidade de sos testos bortados, mescamente pro sos printzipiantes, ma sos tradutores espertos sunt in gradu de l'evitare. Pym (2013) ammentat chi "sos tradutores chi impreant TM/MT tendent a revisionare cada segmentu comente protzedent, lassende pagu tempus pro una revisione finale de su testu intreu", cosa chi diat pòdere èssere sa càusa de unos cantos de sos efetos descritos inoghe.

Castas de sistemas de memòrias de tradutzione[modìfica | modìfica su còdighe de orìgine]

  • Pro elaboradores: sas ainas de memòrias de tradutzione pro elaboradores sunt tipicamente su chi sos tradutores individuales impreant pro agabbare tradutziones. Sunt programmas chi unu tradutore indipendente iscàrrigat e installat in s'elaboradore suo.
  • Basadas subra de serbidores o tzentralizadas: Sos sistemas tzentralizados de memòrias de tradutzione archìviant sas memòrias de tradutzione in unu serbidore tzentrale. Podes traballare paris cun MT in sos elaboradores e podent megiorare sos tassos de 30–60% in prus cunfronta a su chi s'otenit cun sa MT de s'elaboradore ebbia.

Funtziones[modìfica | modìfica su còdighe de orìgine]

Su chi sighit est unu resumu de sas funtziones printzipales de una memòria de tradutzione.

Funtziones non in lìnia[modìfica | modìfica su còdighe de orìgine]

Importatzione[modìfica | modìfica su còdighe de orìgine]

Custa funtzione s'impreat pro tramudare unu testu e sa tradutzione sua dae unu documentu de testu a sa memòria de tradutzione. S'importatzione si podet fàghere dae unu formadu ruzu, in ue unu testu de orìgine est a disponimentu pro s'importatzione a intro de una MT paris cun sa tradutzione sua. A bortas tocat chi s'impreadore torret a protzessare sos testos. B'est un'àteru formadu chi si podet impreare pro s'importatzione: su formadu nativu. Custu formadu est su chi impreat sa MT pro sarvare sas memòrias de tradutzione in un'archìviu.

Anàlisi[modìfica | modìfica su còdighe de orìgine]

Su protzessu de anàlisi incluit sos passos chi sighint:

Anàlisi de su testu
Est de importu mannu a reconnòschere sa puntegiadura in manera curreta in manera chi si potzat distìnghere intre, pro fàghere un'esèmpiu, unu puntu a s'agabbu de una fràsia e unu puntu in un'abbreviatzione. Duncas, s'etichetadura (markup) est una casta de pre-modìfica. De sòlitu sos materiales chi sunt istados protzessados pro mèdiu de programmas tenent etichetas, dae chi sa fase de tradutzione est incorporada in una lìnia de produtzione de documentos multimediales. Àteros elementos de testu ispetziales si diant pòdere innescare pro mèdiu de s'etichetadura. Bi sunt elementos ispetziales chi non tenent bisòngiu de tradutzione, che a sos nùmenes e a sos còdighes, cando chi àteros diant pòdere bisongiare de una cunversione a su formadu nativu.
Anàlisi linguìstica
Sa reduida a formas de base s'impreat pro ammaniare listas de paràulas e unu testu pro su recùperu automàticu de tèrmines dae una banca de tèrmines. A s'àtera ala, s'anàlisi sintàtica si diat pòdere impreare pro estraire tèrmines o fraseologia a prus paràulas dae unu testu de orìgine. Duncas s'anàlisi s'impreat pro normalizare sa variatzione de s'òrdine de sa fraseologia, ite paràulas podent formare una fràsia.
Segmentatzione
Sa punna sua est sa de isseberare sas unidades de tradutzione prus utilosas. Sa segmentatzione est una genia de anàlisi. Benit fata monolinguisticamente impreende un'anàlisi superfitziale e s'alliniamentu est basadu subra de sa segmentatzione. Si sos tradutores acontzant sas segmentatziones in manera manuale, sas versiones imbenientes de su documentu no ant a agatare currispondèntzias cun sa MT in base a sa segmentatzione curreta ca su programma at a repìtere sas faddinas suas. Sos tradutores de sòlitu protzedint fràsia cun fràsia, fintzas si sa tradutzione de una fràsia diat pòdere dipèndere dae da tradutzione de sas chi tenent a fùrriu.
Alliniamentu
Est sa faina de definire sas currispondèntzias intre sos testos de orìgine e de destinatzione. Bi diat dèpere èssere una retroatzione dae s'alliniamentu a sa segmentatzione e un'algoritmu de alliniamentu bonu diat dèpere èssere in gradu de currègere sa segmentatzione de incumintzu.
Estratzione de sos tèrmines
Podet tènnere comente fonte de datos in intrada unu ditzionàriu antepostu. Annotamala, durante s'estratzione de tèrmines disconnotos, podet impreare un'anàlisi basada subra sas istatìsticas de su testu. Custu est ùtile meda pro pranificare e programmare su traballu. Sas istatìsticas de tradutzione de sòlitu contant sas paràulas e càrculant su nùmeru de ripetitziones in su testu.

Esportatzione[modìfica | modìfica su còdighe de orìgine]

S'esportatzione tramudat su testu dae sa MT cara a unu documentu de testu esternu. S'importatzione e s'esportatzione diant dèpere èssere s'una s'imbesse de s'àtera.

Funtziones in lìnia[modìfica | modìfica su còdighe de orìgine]

Durante sa tradutzione una de sas punnas printzipales de sa MT est sa de recuperare sas currispondèntzias prus ùtiles in manera chi su tradutore potzat isseberare sa mègius. Sa MT depet ammustrare siat su testu de orìgine siat su de destinatzione sinnalende sas identidades e sas diferèntzias.

Recùperu[modìfica | modìfica su còdighe de orìgine]

Dae una MT si podent recuperare castas medas de currispondèntzias.

Currispondèntzia esata
Sas currispondèntzias esatas aparint cando sas currispondèntzias intre su segmentu de orìgine currente e su chi est sarvadu est una currispondèntzia caràrere cun caràtere. Durante sa tradutzione de una fràsia una currispondèntzia esata bolet nàrrere chi sa matessi fràsia est istada giai bortada in antis. Sas currispondèntzias esata benint naradas fintzas "currispondèntzias de su 100 %".
Currispondèntzia esata in su cuntestu (ICE) o Currispondèntzia garantida
Una currispondèntzia ICE est una currispondèntzia esata chi si verìficat in manera esata in su matessi cuntestu, est a nàrrere in sa matessi positzione in unu paràgrafu. Su cuntestu est fatu-fatu definidu dae sas fràsias e dae sos atributos a fùrriu, che a su nùmene de s'archìviu de su documentu, sa data e sas autorizatziones.
Currispondèntzia isfocada
Cando sa currispondèntzia no est esata est una currispondèntzia "isfocada". Unos cantos sistemas assignant pertzentuales a custas genias de currispondèntzias, e in custos casos una currispondèntzia isfocada est prus manna de su 0% e prus minore de su 100%. Custas tzifras non si podent cumparare intre sistemas francu chi su mètodu de puntègiu non siat ispetzificadu.
Cuncordàntzia
Cando su tradutore ischertat una o prus paràulas in su segmentu de orìgine su sistema recùperat crobas de segmentos chi currispondent a sos critèrios de chirca. Custa funtzionalidade est de agiudu pro agatare tradutziones de tèrmines e idiomas s'in casu manchet una base de datos de terminologia.

Atualizatzione[modìfica | modìfica su còdighe de orìgine]

Una MT s'agiornat cun una tradutzione noa cando benit atzetada dae su tradutore. Che a semper cando s'atualizat una base de datos, b'est sa chistione de ite fàghere cun sos cuntenutos antepostos de sa base de datos. Una MT si podet modificare mudende·bi o iscantzellende·bi intradas. Unos cantos sistemas permitint a sos tradutores de sarvare tradutziones mùltiplas de su matessi segmentu de orìgine.

Tradutzione automàtica[modìfica | modìfica su còdighe de orìgine]

Sas ainas de memòrias de tradutzione fatu-fatu frunint unu recùperu e una sostitutzione automàticos.

Recùperu automàticu
Si faghet una chirca in sos sistemas de MT e sos resurtados issoro s'ammustrant in automàticu cando su tradutore si movet a intro de unu documentu.
Sostitutzione automàtica
Cun sa sostitutzione automàticas si s'agatat una currispondèntzia esata bortende una versione noa de unu documentu su programma at a repìtere sa tradutzione betza. Si su tradutore non verìficat sa tradutzione cunfrontende·la cun su testu de orìgine una faddina in sa tradutzione anteposta s'at a repìtere.

Traballu in retze[modìfica | modìfica su còdighe de orìgine]

Su traballu in retze permitit a unu grupu de tradutores de bortare unu testu prus in presse cunfronta a su chi diant fàghere si cadaunu diat traballare in isulamentu, ca sas fràsias bortadas dae unu tradutore sunt a disponimentu de sos àteros. In prus, si sas memòria de tradutzione sunt cumpartzidas in antis de sa tradutzione finale, b'at un'oportunidade pro chi sas faddinas de unu tradutore bèngiant acontzadas dae sos àteros membros de su grupu.

Memòria de testu[modìfica | modìfica su còdighe de orìgine]

Sa "Memòria de testu" est sa base de s'istandard propònnidu Lisa OSCAR xml:tm. Sa memòria de testu cumprendet sa memòria de s'autore e sa memòria de tradutzione.

Memòria de tradutzione[modìfica | modìfica su còdighe de orìgine]

Sos identificadores unìvocos benint ammentados durante sa tradutzione in manera chi sa limba de destinatzione siat alliniada in manera esata a su livellu de unidade de su testu. Si su documentu de orìgine est modificadu a pustis tando cussas unidades de testu chi non sunt mudadas si podent tramudare deretu a sa versione de destinatzione noa de su documentu chene bisòngiu de peruna interatzione de su tradutore. Custu est su contzetu de currispondèntizas 'esatas' o 'perfetas' cun sa memòria de tradutzione. xml:tm podet frunire fintzas mecanismos pro currispondèntzias cun levas (currispondèntzias esatas ma in cuntestos diferentes) e isfocadas a intro de su documentu.

Istòria[modìfica | modìfica su còdighe de orìgine]

Sos annos '70 sunt sa fase de incumintzu pro sos sistemas MT in ue sos istudiosos ant fatu unu giru preliminare de arresonos esplorativos. S'idea originale pro sos sistemas MT benit fatu-fatu atribuida a sa publicatzione "Proper Place" de Martin Kay[2], ma sos detàllios non sunt frunidos de su totu. In custa publicatzione s'autore at ammustradu su cuntzetu de base de su sistema de archiviatzione: "Su tradutore diat pòdere incumintzare emitende unu cumandu chi fatzat ammustrare a su sistema totu su chi b'at in memòria chi potzat èssere rilevante pro .... In antis de sighire podet esaminare frammentos de testu betzos e benidores chi cuntenent materiale simigiante". Custa osservatzione de Kay fiat, a nàrrere sa veridade, influentzada dae s'impòsitu de Peter Arthern chi naraiat chi sos tradutores podiant impreare documentos in lìnia simigiantes e giai bortados. In s'artìculu suo de su 1978[3] aiat frunidu una dimustratzione cumpleta de su chi oe mutimus sistemas MT: cale si siat testu nou si diat iscrìere in un'istatzione de elaboratzione de testos e, durante s'iscritura, su sistema diat verificare custu testu ponende·lu a cunfrontu cun sos testos prus betzos archiviados in sa memòria sua, paris cun totu sas tradutziones suas in totu sas àteras limbas ufitziales [de sa Comunidade Europea]. ... Unu vantàgiu cunfronta a sa tradutzione automàtica bera e pròpia diat èssere chi totu sos passàgios recuperados in custa manera diant èssere curretos pro su chi pertocat a sa grammàtica. A beru, diamus dèpere impreare unu protzessu 'còpia e incolla' chi diat, segundu sos càrculos meos, fàghere risparmiare a su nessi su 15 pro chentu de su tempus chi sos tradutores diant pòdere impreare como pro prodùere tradutziones a beru.

S'idea l'ant incorporada sas ainas ALPS (Automated Language Processing Systems - Sistemas Automatizados de Elaboratzione Linguìstica) isvilupados a primu dae chircadores de s'universidade Brigham Young, e tando s'idea de sistemas MT fiat ammisturada cun unu traste mutidu "Elaboratzione de sas ripetitziones" chi punnaiat petzi a agatare istringas currispondentes. Petzi a pustis de unu tempus longu est nàschidu su cuntzetu de sas chi si narant memòrias de tradutzione.

Sa prima fase esplorativa bera de sos sistemas MT diant èssere sos annos '80. Una de sas primas implementatziones de sos sistemas MT est apàrrida in sa Banca de Connoschèntzia Bilìngue de Sadler and Vendelmans. Una Banca de Connoschèntzia Bilìngue est una croba de còrpora istruturada in manera sintàtica e referentziale, essende una una tradutzione de s'àtera, in ue sas unidades de tradutzione sunt codificadas in manera rugradas intre sos còrpora. Sa punna de sa Banca de Connoschèntzia Bilìngue est sa de isvilupare una fonte de connoschèntzia genèrica basada supra de sos còrpora pro aplicatziones in sa tradutzione automàtica e in sa tradutzione agiudada dae s'elaboradore (Sadler & Vendelman, 1987). Un'àteru passu de importu l'at fatu Brian Harris cun su "Bi-testu" suo. Issu at definidu su bi-testu che a "unu testu sìngulu in duas dimensiones" (1988), cun sos testos de orìgine e de destinatzione ligados dae s'atividade de su tradutore pro mèdiu de unidades de tradutzione chi ant tentu efetos simigiantes a sa Banca de Connoschèntzia Bilìngue de Sadler. E in su traballu de Harris issu at propostu una cosa a tipu sistema de MT chene impreare custu nùmene: una base de datos de tradutziones crobadas, chi si podent chircare o pro mèdiu de paràulas individuales o cun "unidades de tradutzione intreas". In custu ùrtimu casu sa chirca est permìtida pro recuperare unidades simigiantes in logu de sas idènticas.

Sa tecnologia MT est divènnida a disponimentu pro su cummèrtziu a iscala manna petzi in s'ùrtima parte de sos annos '90, gràtzias a sos isfortzos fatos dae medas ingennieris e tradutores. De annotu est sa prima aina de MT mutida Trados (oe SDL Trados). In custu traste, durante s'abertura de s'archìviu de orìgine b'at s'aplicatzione de sa memòria de tradutzione in manera chi cale si siat "currispondèntzia de su 100%" (currispondèntzias idènticas) o "currispondèntzias isfocadas (currispondèntzias no idènticas ma simigiantes) intro a su testu siant estraidas e postas in automàticu a intro de s'archìviu de destinatzione. A pustis, sas currispodèntzias cussigiadas dae sa memòria de tradutzione si podent atzetare o subraiscrìere cun alternativas noas. Si un'unidade de tradutzione est annoada in manera manuale, tando benit sarvada a intro de sa memòria de tradutzione pro impreos benidores e fintzas pro sas ripetitziones in su testu currente. In manera simigiante totu sos segmentos in s'archìviu de destinatzione chene una currispondèntzia diant èssere traduidos in manera manuale e a pustis annantos in automàticu a sa memòria de tradutzione.

In sos annos '00, sos servìtzios de tradutzione in lìnia ant incumintzadu a incluire MT. Servìtzios de tradutzione automàtica che a Google Translate, paris cun servìtzios professionales e "ìbridos" frunidos dae sitos che a Gengo e Ackuna, incorporant bases de datos de MT frunidos dae tradutores e voluntàrios pro creare connessiones prus efitzientes intre limbas e frunire servìtzios de tradutzione prus lestros a sos utentes finales.

Tendèntzias reghentes[modìfica | modìfica su còdighe de orìgine]

Unu isvilupu reghente est su cuntzetu de 'memòria de testu' in cuntrastu cun sa memòria de tradutzione. Custa est fintzas sa base de sa proposta de istandard LISA OSCAR.[4] Sa memòria de testu a intro de xml:tm cumprendet 'memòria de autore' e 'memòria de tradutzione'. Sa memòria de autore s'impreat pro sighire e ammentare sas modìficas durante su tziclu decreatzione. Sa memòria de tradutzione impreat sas informatziones dae sa memòria de autore pro implementare currispondèntzias de sa memòria de tradutzione. Fintzas si est pro su prus destinada a documentos XML, xml:tm si podet impreare in cale si siat documentu chi si podet cunvertire a su formadu XLIFF.

Memòrias de tradutzione de sa de duas generatziones[modìfica | modìfica su còdighe de orìgine]

Meda prus poderosas de sos sistemas de MT de prima generatzione, incluint unu motore de anàlisi linguìstica e impreant sa tecnologia a blocos pro truncare sos segmentos in grupos terminològicos inteligentes e ingendrare in automàticu glossàrios ispetzìficos.

Istandards ligados[modìfica | modìfica su còdighe de orìgine]

TMX[modìfica | modìfica su còdighe de orìgine]

Su Translation Memory eXchange ("Cuncàmbiu de memòrias de tradutzione", acrònimu:TMX) est un'istandard chi permitit su cuncàmbiu de memòrias de tradutzione intre frunidores de tradutziones. Sa comunidade de sos tradutores l'at adotadu TMX comente mègius manera de importare e esportare memòrias de tradutzione[tzitatzione netzessària]. Sa versione currente est sa 1.4b - permitit de torrare a creare sos documentos de orìgine e de destinatzione partende dae sos datos TMX.

TBX[modìfica | modìfica su còdighe de orìgine]

TermBase eXchange (Cuncàmbiu de bases de terminologia). Custu istandard LISA, chi ant revisionadu e torradu a publicare comente ISO 30042, permitit su cuncàmbiu de datos de terminologia chi incluint informatziones lessicales a sa minuda. S'istrutura pro su TBX la frunint tres istandards ISO: ISO 12620, ISO 12200 and ISO 16642. ISO 12620 frunit un'inventàriu de "categorias de datos" definidas comente si tocat cun nùmenes istandardizados chi funtzionant che a castas de elementu de datos o che a valores predefinidos. ISO 12200 (connotu fintzas comente MARTIF) frunit sa base pro s'istrutura tzentrale de su TBX. ISO 16642 (connotu fintzas comente Terminological Markup Framework, Istrutura de Etichetadura Terminològica) incluit unu meta-modellu istruturale pro sos limbàgios de etichetadura (markup) terminològica in generale.

UTX[modìfica | modìfica su còdighe de orìgine]

Su formadu Universal Terminology eXchange ("Cuncàmbiu terminològicu universale", acrònimu: UTX) est un'istandard progetadu in manera ispetzìfica pro sos ditzionàrios de utente de tradutzione automàtica, ma si podet impreare fintzas pro glossàrios generales e chi sas persones podent lèghere. Sa punna de s'UTX est sa de atzellerare sa cumpartzidura e su reimpreu de ditzionàrios gràtzias a sas caraterìsticas ispetzìficas suas chi sunt simpres e pràticas meda.

SRX[modìfica | modìfica su còdighe de orìgine]

Su Segmentation Rules eXchange ("Cuncàmbiu de Règulas de Segmentatzione", acrònimu: SRX) tenet sa punna de megiorare s'istandard TMX in manera chi sos datos de memòria de tradutzione chi si cumcambiant si podent impreare in manera prus eficatze. Sa possibilidade de ispetzificare sas règulas de segmentatzione chi fiant istadas impreadas in sa tradutzione anteposta diant pòdere crèschere sa leva chi si podet otènnere.

GMX[modìfica | modìfica su còdighe de orìgine]

GILT Metrics (Mètricas GILT). GILT est un'acrònimu pro Globalization, Internationalization, Localization, and Translation (Globalizatzione, Internatzionalizatzione, Localizatzione, e Tradutzione). S'istandard GILT Metrics cumprendet tres partes: GMX-V pro mètricas de volùmene, GMX-C pro mètricas de cumplessidade GMX-Q pro mètricas de calidade. S'istandard GILT Metrics propostu tenent su còmpitu de carculare sa mole de traballu e sos rechisidos de calidade pro cale si siat faina GILT.

OLIF[modìfica | modìfica su còdighe de orìgine]

Open Lexicon Interchange Format (Formadu de Cuncàmbiu de Lèssicu Abertu). S'OLIF est un'istrandard abertu e cunforme a s'XML-pro su cuncàmbiu de datos terminològicos e lessicales. Fintzas si sa punna sua fiat in orìgine sa de èssere unu mèdiu pro su cuncàmbiu de datos lessicales intre lèssicos de tradutzione automàtica propietàrios, s'est evòlvidu cara a un'istandard prus generale pro su cuncàmbiu de terminologia.

XLIFF[modìfica | modìfica su còdighe de orìgine]

Su XML Localisation Interchange File Format (Formadu de Archìviu de Cuncàmbiu de Localizatione XML) tenet sa punna de frunire unu formadu de archìviu de cuncàmbiu ùnicu chi cale si siat frunidore de localizatziones potzat cumprèndere. S'XLIFF est sa manera preferida[5] de cuncambiare datos in formadu XML in s'indùstria de sas tradutziones.

TransWS[modìfica | modìfica su còdighe de orìgine]

Translation Web Services (Servìtzios Web de Tradutzione). TransWS ispetzìficat sas mutidas netzessàrias pro impreare servìtzios web pro s'imbiu e su recùperu de archìvios e messàgios ligados a progetos de localizatzione. Sa punna sua est sa de fàghere de istrutura fata a sa minuda pro s'automatzione de meda de sos protzessos de localizatzione currentes pro mèdiu de sos servìtzios web.

xml:tm[modìfica | modìfica su còdighe de orìgine]

Sa metodologia xml:tm (XML-based Text Memory, Memòria de Testu basada subra de XML) pro sa memòria de traduzione est badada subra su cuntzetu de memòria de testu chi cumprendet sas memòrias de autore e de tradutzione.[6] Su xml:tm est istadu donadu a su Lisa OSCAR dae XML-INTL.

PO[modìfica | modìfica su còdighe de orìgine]

Gettext Portable Object format (Formadu de Ogetu Portàtile Gettext). Nointames su fatu chi fatu-fatu non benit cunsideradu che a unu formadu de memòria de tradutzione, sos archìvios PO Gettext sunt documentos bilìngues chi s'impreant fintzas in protzessos de memòrias de tradutzione in sa matessi menara chi de sas memòrias de tradutzione. De sòlitu unu sistema de memòria de tradutzione PO at a cunsìstere in archìvios separados diferentes in un'istrutura a àrbore de cartellas. Trastes comunes chi traballant cun archìvios PO incluint sos Trastes GNU Gettext (GNU Gettext Tools) e sa Cassita de Trastes de Tradutzione (Translate Toolkit). Esistint fintzas medas ainas e programmas chi modificant sos archìvios PO comente chi siant petzi documentos de testu de orìgine.

Artìculos ligados[modìfica | modìfica su còdighe de orìgine]

Riferimentos[modìfica | modìfica su còdighe de orìgine]

  1. 1.0 1.1 (EN) Elina Lagoudaki, Translation Memory systems: Enlightening users' perspective. Key finding of the TM Survey 2006 carried out during July and August 2006 (PDF), Imperial College London, Translation Memories Survey 2006, 2006, p. 16. URL consultadu su 25 martzu 2007 (archiviadu dae s'url originale su 25 martzu 2007).
  2. (EN) Martin Kay, The Proper Place of Men and Machines in Language Translation, in Machine Translation, vol. 12, 1–2, martzu 1997, pp. 3–23, DOI:10.1023/A:1007911416676.
  3. (EN) Peter Arthern, Machine Translation and Computerized Terminology Systems: A Translator's Perspective (PDF), in Translating and the Computer: Proceedings of a Seminar, London, 14th November, 1978, 1978. URL consultadu su 9 freàrgiu 2022 (archiviadu dae s'url originale su 19 austu 2019).
  4. (EN) Translating XML Documents with xml:tm, in www.xml.com. URL consultadu su 9 freàrgiu 2022.
  5. (EN) DITA Translation SC | OASIS, in www.oasis-open.org. URL consultadu su 29 ghennàrgiu 2021.
  6. (EN) Andrzej Zydroń, OAXAL—What is it and why should I care, in CIDM Information Management News, austu 2008 (archiviadu dae s'url originale su 17 maju 2013).
    «At the core of xml:tm are the following concepts which together make up 'Text Memory': Author Memory and Translation Memory.».

 

Bibliografia[modìfica | modìfica su còdighe de orìgine]

  • Dragsted, Barbara. (2004). Segmentation in translation and translation memory systems: An empirical investigation of cognitive segmentation and effects of integrating a TM system into the translation process. Copenhagen: Samfundslitteratur. 369 p.
  • Heyn, Matthias. (1998). “Translation memories: Insights and prospects”. In: Lynne Bowker; et al. (eds.), Unity in diversity? Current trends in translation studies. Manchester: St. Jerome. P. 123–136.
  • Martín-Mor, Adrià (2011), La interferència lingüística en entorns de Traducció Assistida per Ordinador: Recerca empíricoexperimental. Bellaterra: Universitat Autònoma de Barcelona. URL: http://www.tdx.cat/handle/10803/83987.
  • O’Hagan, Minako. (2009). “Computer-aided translation (CAT)”. In: Mona Baker & Gabriela Saldanha (eds.), Routledge encyclopedia of translation studies. Londra: Routledge. P. 48–51.
  • Pym, Anthony (2013). Translation Skill-Sets in a Machine-Translation Age. Meta: Translators' Journal, 58 (3), p. 487-503. URL: http://id.erudit.org/iderudit/1025047ar

Ligàmenes esternos[modìfica | modìfica su còdighe de orìgine]