¿Sobre qué tema quieres leer? Tenemos (casi) de todo

Todavía hay más temas... busca aquí el que te interesa

24 de marzo de 2010

Un artículo sobre el traductor de Google traducido por el traductor de Google

Son impresionantes los avances que se han introducido a la herramienta de traducción de Google. Ahora, en lugar de tomar las palabras de forma aislada y traducirlas una a una para forma oraciones ridículas, toma frases enteras y busca alguna similar y su traducción en una base de datos. A continuación reproduzco un artículo del New York Times al respecto —gracias, Dan, por el aviso—, pero ya traducido por esta herramienta para que, a la vez que lo leéis, podáis ver qué tipo de resultados ofrece este traductor:

Cada uno tiene su propia historia de la traducción terrible de decir - el menú de un restaurante incomprensible en Croacia, una señal de advertencia cómicamente analfabetos en una playa francesa. "Human-ingeniería" traducción es tan inadecuada en los dominios más importantes. En nuestros tribunales y los hospitales, en los traductores de servicios militares y de seguridad, mal pagados y sobrecargados de trabajo que confunde de millones de interacciones vitales. La traducción automática sin duda puede ayudar en estos casos. Su legendario bloopers son a menudo no son peores que los errores cometidos por el hombre en apuros.

La traducción automática ha resultado ser útil en las situaciones más urgentes. Cuando Haití fue devastada por un terremoto en enero, los equipos de socorro acudieron a las isla destrozada, hablando docenas de idiomas -, pero no criollo haitiano. ¿Cómo podría un superviviente atrapado con un teléfono celular obtener información útil a los equipos de rescate? Si tenía que esperar a que un chino o turco o un intérprete Inglés a su vez hasta podría estar muerto antes de ser comprendido. La Universidad Carnegie Mellon de inmediato dio a conocer su criollo haitiano hablado y datos de texto, y una red de desarrolladores voluntarios produjo un áspero-y-listo sistema de traducción automática de creole haitiano en poco más de un fin de semana largo. No produjo en prosa de gran belleza. Pero funcionó.

Las ventajas y desventajas de la traducción automática han sido objeto de un debate cada vez mayor entre los traductores humanos últimamente debido a los avances cada vez más hizo en el último año por el participante más reciente e importante en el campo, Google Translate. Pero este debate en realidad comenzó con el nacimiento de la traducción automática en sí.

La necesidad de la traducción automática de crudo se remonta al inicio de la guerra fría. Los Estados Unidos decidió que había que examinar cada pedazo de Rusia sale de la Unión Soviética, y no sólo los traductores no eran suficientes para mantenerse al día (al igual que no hay suficientes ahora para traducir todos los idiomas que los Estados Unidos quiere monitor). La guerra fría coincidió con la invención de computadoras, y de "fracaso de Rusia" fue una de las primeras tareas de estas máquinas fueron establecidos.

El padre de la traducción automática, William Weaver, eligió respecto de Rusia como un "código" ocultando el verdadero significado del texto. Su equipo y sus sucesores, aquí y en Europa, en una forma de sentido común: un lenguaje natural, se calcula, se hace de un léxico (un conjunto de palabras) y una gramática (un conjunto de reglas). Si usted puede obtener los léxicos de dos lenguas dentro de la máquina (bastante fácil) y darle también la totalidad conjunto de normas por las que los seres humanos construyen combinaciones de palabras significativas en las dos lenguas (una propuesta más dudosa), entonces la máquina sería capaz de traducir del código uno "," en otro.

Lingüistas Académico de la época, jefe de Noam Chomsky, entre ellos, también vio una lengua como un diccionario y una gramática, capaz de generar muchas oraciones infinitamente diferentes de un conjunto finito de reglas. Pero como el anti-lingüistas Chomsky en Oxford, comentó a la vez, también hay infinitamente muchos automóviles que pueden salir de una fábrica de automóviles británico, cada uno con algo diferente de malo. Durante los próximos cuatro décadas, la traducción automática logrado muchos resultados útiles, pero, como la industria automotriz británica, está muy lejos de las esperanzas de la década de 1950.

Ahora tenemos un animal de una especie diferente. Traductor Google es un sistema de traducción automática estadística, lo que significa que no se trate de descoser o entender nada. En lugar de tomar una frase en pedazos y luego la reconstrucción en "objetivo" la lengua como los traductores de más edad máquina lo hace, Google Translate busca frases similares en los textos ya traducidos en algún lugar en la Web. Después de haber encontrado la coincidencia existente más probable es que a través de un dispositivo increíblemente inteligente y rápida de cómputo estadísticos, la tos Google Translate it up, en bruto o, en su caso, ligeramente cocidas. Así es como se simula - pero sólo simula - lo que suponemos que pasa en la cabeza de un traductor.

Traductor Google, que hasta ahora se puede manejar 52 idiomas, elude cuestión teórica de los lingüistas de lo que el lenguaje es y cómo funciona en el cerebro humano. En la práctica, las lenguas se utilizan para decir las mismas cosas una y otra vez. Para tal vez 95 por ciento de todas las expresiones, la urraca electrónico de Google es una herramienta fabulosa. Pero hay dos limitaciones importantes que los usuarios de este o cualquier otro sistema de traducción automática estadística tienen que entender.

La frase de destino proporcionadas por Google Translate no es y nunca debe confundirse con la traducción "correcta". Eso no es justo porque no hay tal cosa como una "traducción correcta" realmente existe. Es también porque Google Translate sólo da una expresión consistente de las frases equivalentes más probable según los cálculos de su análisis de un conjunto astronómica de oraciones par de arrastre de la Web.

Los datos provienen en gran parte de la documentación de las organizaciones internacionales. Miles de traductores humanos que trabajan para las Naciones Unidas y la Unión Europea y así sucesivamente han invertido millones de horas de producción precisamente las parejas que Google Translate está ahora en condiciones de quedarse con la mejor. Las traducciones humanos tienen que venir primero de Google para traducir a tener nada que trabajar.

La calidad variable de Google Translate en las parejas de idiomas diferentes disponibles se debe en gran parte a la disparidad en las cantidades de traducciones humanas de ingeniería entre los idiomas en la Web.

Pero lo de escribir de verdad? Traductor Google puede hacer milagros aparentes, ya que tiene acceso a la biblioteca de mundo de los libros de Google. Esto es probablemente por qué, cuando se le preguntó a traducir una frase célebre sobre el amor de "Les Misérables" - "El n'a pas d'autre perle à trouver dans les plis ténébreux de la vie" - Traductor de Google viene con un muy meritorio "Hay no es otra perla que se encuentran en los pliegues oscuros de la vida ", que resulta ser idéntica a una de las muchas traducciones publicadas de que la gran novela. Es un truco impresionante para un ordenador, pero para un ser humano? Todo lo que necesitas hacer es obtener el libro de bolsillo de edad de su sótano.

Y el programa es muy desigual. La frase inicial de Proust "En busca del tiempo perdido" sale como un tiempo gramatical "Mucho me fui a la cama temprano," y los resultados para la mayoría de otros clásicos modernos son tan inutilizable.
¿Puede Google Translate nunca ser de alguna utilidad para la creación de nuevas traducciones literarias al Inglés u otro idioma? La primera cosa a decir es que realmente no hay necesidad de ella para hacer eso: los futuros traductores de literatura extranjera no son escasos - son gritos por más oportunidades de publicar sus trabajos.

Pero incluso si la necesidad estaba allí, Google Translate no podía hacer nada útil en este dominio. No es concebido o programado para tener en cuenta la finalidad, contexto del mundo real o el estilo de cualquier enunciado. (Cualquier sistema capaz de hacer eso sería un logro realmente trascendental, pero ese milagro no está en el orden del día, incluso los desarrolladores de traducción más avanzada de la máquina.)

Sin embargo, para jugar de abogado del diablo por un momento, si fuera a tener una visión decididamente ictericia de algún género de ficción extranjera contemporánea (por ejemplo, las novelas francesas del adulterio y la herencia), se puede suponer que, dado que dichas obras no tienen nada nuevo que decir y sólo emplean fórmulas repetidas, después de un número suficiente de novelas traducidas de este tipo y sus originales habían sido escaneados y que se presenten en la Web, Google Translate debe ser capaz de hacer una simulación bastante buena de la traducción de regurgitaciones otros de la misma calaña.

¿Y qué? Eso no es lo que se trata de la traducción literaria. Para las obras que son verdaderamente original - y por lo tanto vale la pena traducir - traducción automática estadística no tiene ni la esperanza. Traductor Google puede proporcionar servicios estupendos en muchos ámbitos, pero no está configurado para interpretar o hacer que el trabajo de leer de que no es habitual - y es injusto pedir a intentarlo. Después de todo, cuando se trata de los verdaderos retos de la traducción literaria, los seres humanos tienen un tiempo duro de la misma, también.


He aquí el original.