Hacemos accesible Internet a las Empresas

Teléfono Fijo 91 881 47 19

91 881 47 19

Horario de Atención
de L a V de 9:30 a 14:00
y de 17:00 a 19:00

hablamos de tu proyecto
Lunes, 26 Mayo 2014 06:30

Así funciona el traductor de Google: siempre en inglés y tirando de estadística

Escrito por 
Valora este artículo
(1 Voto)

Unos más que otros, pero todos hemos usado alguna vez el traductor de Google. Ahora bien, ¿sabemos cómo funciona este intérprete que aparentemente sabe más de 80 idiomas? La respuesta se aleja mucho de los libros de gramática y los diccionarios: Google Translate funciona a base de estadística y un poco de economía.

Imagen: Horia Varlan

En pleno siglo XXI, parece que una de las muchas obsesiones de las grandes compañías tecnológicas es superar una de las mayores barreras que separan a los seres humanos: el idioma.

Si en 2014 parece haber una carrera por lanzar al mercado el ‘wearable’ definitivo, desde hace años se disputa otra carrera, esta de fondo, para ver qué compañía desarrolla el traductor perfecto. Microsoft, IBM y, por supuesto, Google, protagonizan una lucha encarnizada con el objetivo de crear una herramienta que, gracias a la inteligencia artificial, permita traducirlo todo, incluso conversaciones de forma simultánea.


GOOGLE A LA CABEZA

Con más de mil millones de traducciones al día, no es una sorpresa que el intérprete de Google sea el más popular. Aunque se haga algún chiste que otro sobre los errores que comete, quien más y quien menos ha recurrido alguna vez el invento de los chicos de Mountain View. Sin embargo, pocos sabrían responder a la gran pregunta: ¿cómo diantres funciona?

Si crees que la clave está en el grupo de lingüistas que trabajan para Google, estás equivocado: el equipo de investigación de la ‘gran G’ encargado de la traducción automática, dirigido por el informático alemán Franz Joseph Oz, no cuenta con filólogos ni lingüistas entre sus filas, pero eso no le ha impedido romper la barrera del idioma.

Tal y como explica Peter Norvig, director de investigación de Google, tratar de enseñarle al sistema el vocabulario y las reglas gramaticales de todos los idiomas que traduce es poco menos que inviable. A día de hoy, Google Translate trabaja con 80 lenguas distintas. Si enseñarle a un ordenador 80 gramáticas diferentes ya sería un esfuerzo titánico, la complejidad se incrementa aún más si tenemos en cuenta las excepciones que tiene todo idioma y lo peor de todo: la evolución de cada uno de ellos.

Idiomas Traductor de Google

Google es capaz de traducir 80 idiomas actualmente (Google Translate)

“El lenguaje es tan fluido y extenso que los programadores no pudieron con las millones de palabras y las miles de millones de combinaciones que se pueden dar entre ellas, y sobre cómo cambian con el tiempo”, señala Norvig en uno de los blogs de Google.

¿Cómo superar entonces los problemas derivados de las excepciones lingüísticas y de los cambios del lenguaje? La solución tiene poco que ver con la gramática: Translate funciona a golpe de estadística.

Con una base de datos que recopila millones de textos traducidos a todos los idiomas con los que trabaja, el sistema interpreta cómo debe traducir cada cosa en cada momento. Gracias a esos textos, la herramienta establece qué patrones debe seguir a la hora de realizar las traducciones.

En otras palabras, el traductor de Google funciona simple y llanamente rebuscando entre las traducciones realizadas por profesionales de carne y hueso, a través de un proceso denominado “traducción automática estadística”: “esta frase en inglés parece que se traduce en esta otra frase al español, pero sólo si está cerca de esta otra palabra”, resume Norvig.

De esta forma, los errores que suelen encontrarse en las traducciones son comprensibles, pero ¿no podrían evitarse? Poco a poco. La calidad de la interpretación solo puede mejorarse aumentando la cantidad de textos trabajados por profesionales que Google almacena en su base de datos.


EL SECRETO MEJOR GUARDADO

Aún hay un pequeño detalle del mecanismo de traducción de Google que quizás te interese saber: la herramienta de la ‘gran G’ no traduce directamente entre idiomas distintos del inglés, sino que hace un alto en el camino para visitar la lengua de Shakespeare.

Cuando intentas traducir algo del suajili al maorí (o del español al francés), Translate no lo hace directamente. Primero se encarga del trabajo sucio en inglés y después presenta al usuario el resultado definitivo. Sin embargo, al contrario de lo que puedas estar pensando, no lo hace por una cuestión de etnocentrismo anglosajón, sino por cuestiones de economía pura y dura.

Para entender por qué Google se lleva todas nuestras palabras al inglés antes de traducirlas, lo primero que debemos hacer es irnos a un aeropuerto. Bueno, realmente debemos imaginar la red de aeropuertos de un país. Si una aerolínea quiere conectar todas y cada una de las ciudades de un país puede hacerlo de dos formas: enviando aviones desde y hacia todas las ciudades, o bien enviando los aviones a una ciudad central desde la cual se distribuyan los vuelos hacia el resto. Aunque el resultado es el mismo, los dos modelos son totalmente distintos.

Se trata del paradigma de distribución ‘spoke-hub’ – o paradigma de distribución radial – y permite un ahorro sustancial de recursos. Para el ejemplo clásico se utilizan los aeropuertos estadounidenses: si una compañía aérea quiere operar en una ciudad de cada uno de los cincuenta estados del país, necesita, como mínimo, más de dos mil vuelos diarios:

50 estados x 49 ciudades= 2450 vuelos diarios

Sin embargo, utilizando el paradigma de distribución radial, la cantidad se reduce sustancialmente. Continuando con el ejemplo yanqui, el modelo plantea llevar un avión desde cada estado hasta Denver y que, desde allí, los aviones partan hacia su destino final.

Paradigma de distribución radial
Paradigma de distribución radial (Imagen: Wikipedia)

En este caso, se multiplicarían 49 vuelos diarios por 2 (el viaje hasta Denver y el vuelo desde Denver hasta el destino final). El resultado: tan solo 98 vuelos al día.

Pues bien, con el sistema empleado por Google sucede exactamente lo mismo. La ‘gran G’ podría traducir directamente entre sí los 80 idiomas con los que trabaja, pero resulta mucho más económico, en lo que a recursos se refiere, llevar 79 lenguas al inglés y desde ahí, traducir al idioma que desea el usuario.

Además, hay otro motivo de peso que va más allá del paradigma de la distribución radial. Para Google es mucho más fácil recopilar documentos traducidos desde cualquier idioma al inglés que entre las distintas lenguas que traduce su sistema. Obviamente, a los chicos de Mountain View no les faltarán textos traducidos del francés al español; sin embargo, es bastante probable que no abunden los documentos traducidos del igbo nigeriano al criollo haitiano. Es mucho más probable que de estos dos idiomas circulen textos traducidos al inglés que entre sí.

Visto así, todo encaja: Google tiene almacenadas toneladas de textos que tienen como origen o destino el inglés, lo que convierte a la lengua de Shakespeare en el Denver de Google. Sin embargo, este método también provoca algunos fallos de traducción que, si Google Translate funcionara de otra forma, probablemente no existirían.

 

EL FALLO HISPANO-FRANCÉS

Es muy sencillo pillar al traductor de Google. Tan solo hay que tratar de traducir al castellano la segunda persona del plural del verbo francés “être”. En nuestro idioma, el “vous êtes” puede traducirse por dos formas verbales diferentes: o bien por un “vosotros sois” de toda la vida; o por la fórmula de cortesía en plural, es decir, “ustedes son”.

¿Qué opción elige por defecto Google para esta traducción tan sencilla? Ninguna de las dos. Google Translate lo traduce de forma errónea por “eres”. 

Si aún no has caído en cuál puede ser el motivo, solo tienes que realizar la traducción al estilo Google; es decir, haciendo una parada previa en el inglés.

La segunda persona del presente del verbo francés “être” se traduce al inglés siempre de la misma forma. Da igual que sea en singular, en plural o con la fórmula de cortesía. En inglés “vous êtes” es “you are”. Una vez que Google tiene en las manos esa expresión tan polifacética del inglés, y con el matiz del plural y la cortesía totalmente perdidos, ¿cómo traducirlo al español?

La respuesta es sencilla: siguiendo los parámetros que la traducción automática estadística obtiene de los textos traducidos del inglés al español que almacenan en su base de datos. Vale, igual no es tan sencilla, pero viene a significar que cambiará “you are” por la fórmula más repetida en los textos que pasan del inglés al español: “eres”.

Estimados amigos de Google, pasarlo todo por el tamiz anglosajón hace que vuestro traductor, el más utilizado en el mundo, cometa algún que otro fallo entre idiomas tan cercanos como el español y el francés. Algún texto traducido habrá entre esos idiomas, ¿no? ¡Que somos vecinos, hombre!

Fuente: Hoja de Router

Creative Commons


 

Visto 4881 veces Modificado por última vez en Jueves, 13 Agosto 2015 12:11

Artículos relacionados (por etiqueta)

  • Google marca como "no seguras" aquellas webs que no cuenten con SSL
    ¿Entrarías a una web que tu navegador te señala como no segura? Esto es lo que sucede desde julio de 2018 si cualquier usuario intenta acceder a una página web a través de Google Chrome. Esto se debe a que entre los objetivos de Google está el de crear un Internet seguro para todos. Tal es la importancia que ha otorgado a este aspecto el conocido buscador que tener un certificado SSL instalado es un factor clave en el algoritmo que determina el posicionamiento de una web.

     

    Google marca como "no seguras" aquellas páginas web que no cuenten con un certificado SSL


    Proteje y da confianza a tus clientes en cualquiera de las operaciones que realicen en tu página web. Cuando entramos en una web necesitamos confiar en su autenticidad y seguridad. Un certificado SSL es la transmisión segura de información a través de internet.
    Las siglas SSL responden a los términos en inglés (Secure Socket Layer), el cual es un protocolo de seguridad que hace que tus datos viajen de manera íntegra y segura. El certificado protege la información que envían tus clientes desde su ordenador hasta que llega al servidor donde está alojada tu página web (hosting). La información se manda de forma encriptada con una fuerza desde 256bits (dependiendo del certificado contratado), evitando problemas de seguridad y que los datos de los clientes acaben en manos de terceros. Instalar un certificado digital, es una recomendación de la Agencia de Protección de datos Española. Los certificados llevan un seguro de responsabilidad civil para, en caso de fallo, cubrir daños.

    Si quieres que los visitantes de tu página web la perciban como segura necesitas tener un certificado SSL


    Para saber si una página web tiene instalado un SSL puedes observar estos indicadores:


    Ventajas de tener un certificado SSL en tu web


    ¿Todavía no lo tienes claro? A continuación te resumimos los principales beneficios de tener instalado un certificado SSL para tu web:
    • Da confianza a tus visitantes. Cualquier potencial cliente que vea los signos indicativos de tu SSL (https, barra verde y candado) sabrá que puede confiar en tu site para dejar sus datos, incluso los más personales. Esto se puede traducir en una compra o en la repetición de la visita.
    • Mejora tu SEO. Con un certificado SSL instalado en tu site, buscadores como Google entienden que buscas la seguridad para tus usuarios por lo que te premian con un mejor posicionamiento.
    • Garantiza el intercambio de datos. Gracias al cifrado de los datos, toda la información que se transfiera en tu web estará segura. Es decir, nadie ajeno podrá consultarla y efectuar acciones maliciosas con ella. Esto es fundamental si tus clientes tienen que darte datos de carácter confidencial o sensibles.


    Demuestra a tus visitantes y a Google que tu web es segura
    incluyendo un Certificado SSL

    Si necesitas un certificado SSL para tu web,
    llámanos 91 881 47 19

     

    Fuente:  Solución Individual

    creative-commons-ccbysa

     

     

  • Alternativas gratuitas a Google Analytics

    Si hay algún lugar en el mundo en el que todo es medible (además de posible), ese es Internet. Las empresas son cada vez más conscientes de que recoger, estudiar y analizar los datos de navegación de los usuarios ayuda a mejorar la presencia on line de la marca. En este escenario, existen herramientas muy interesantes de medición que ofrecen las mismas métricas que Google Analytics teniendo en cuenta aspectos como la facilidad de uso o la funcionalidad y sin perjuicio de la privacidad de los datos extraídos. Os lo contamos.

  • Copias de seguridad con Google Drive

    Drive es uno de los servicios de Google más versátiles. Empezó como espacio online para guardar documentos pero en la actualidad también sirve para organizar tus fotos, crear, editar y compartir documentos y hacer backup de tu PC.

  • El Escáner de fotos de Google se llama Photoscan

    Muchos guardamos una caja de zapatos o de galletas con fotografías antiguas. ¿Y si pudiéramos digitalizarlas para arreglarlas e imprimir copias mejoradas? El nuevo escáner de fotos de Google, Photoscan, permite hacerlo fácilmente.

  • Cómo buscar en Google

    En este artículo te mostramos algunos consejos para realizar búsquedas en Google de manera más efectiva, y así obtener los resultados que estén relacionados con los términos que andas buscando. Te sorprenderá las diferentes posibilidades de buscar que ofrece el buscador.

Deja un comentario

Asegúrate de llenar la información requerida marcada con (*). No está permitido el código HTML. Tu dirección de correo NO será publicada.

¡Atención! Este sitio utiliza cookies.

Si no cambia la configuración de su navegador, usted acepta su uso. Saber más Acepto

logo cabecera web
EIE (Espacio de Iniciativas Empresariales)
Parque Empresarial La Garena
C/Blas Cabrera, 23
Alcalá de Henares - Madrid
Teléfono: 91 881 47 19
Mapa Localización 

 

telefono web
Teléfono de atención al cliente: 91 881 47 19
de Lunes a Viernes de 9:30 a 14:00 y de 17:00 a 19:00

Horario de Verano
de Lunes a Viernes de 9:00 a 15:00
del 15 de junio al 1 de septiembre

Diseño Gráfico | Diseño Web

Solución Individual ® y su Logotipo son
Nombre Comercial y Marca Registrada.
 © Reservados Derechos de Autor 2010

Te puede interesar: Sistema Reservas Online | Gestión Inmobiliaria | Agencia Viajes

Servicios: Contratación de Dominios | Contratación de Certificados SSL | Hosting Web en España

Partners: TODOAUNCLIC.es

Producimos: Diseño Web en Alcalá de Henares | Tiendas Online en Alcalá de Henares | SEO

social facebook   social twitter   social flickr   social pixabay   social pinterest   social youtube   social todoaunclic 

 

 Los precios indicados en esta web NO incluyen el IVA