Transcribir conversaciones: de Google y lingüistas (Lingüística e Idiomas)

La noticia saltó este verano: Google admitía haber transcrito una parte de las grabaciones obtenidas mediante su asistente personal para transcribir y almacenar dichas conversaciones. Aunque la noticia se ha tratado en la prensa en términos de privacidad y abuso de autoridad, a nosotros los lingüistas esta noticia nos sugiere la aplicación práctica de una técnica dolorosamente laboriosa que se desarrolló en los años setenta en Estados Unidos: la transcripción de conversaciones.

Hasta la invención del radiocassette portátil, la grabación de conversaciones era prácticamente imposible, ya que solo se podía realizar llevando a un par de hablantes a un estudio de grabación y, normalmente, estos estaban tan cohibidos que el lenguaje que producían no era el suyo, sino una adaptación de lo que creían que se debía decir. Si quería investigar el habla coloquial, al lingüista no le quedaba otra alternativa que tomar notas y fiarse de su memoria; más o menos lo que hacía un Gary Cooper lingüista en esta escena (¡lo que ha cambiado Hollywood!).

A finales de los años sesenta, sin embargo, las cosas cambian: es el investigador el que se puede desplazar al lugar donde están los hablantes y registrar su habla con la ayuda de una grabadora portátil. Surge así una disciplina dedicada a estudiar las conversaciones cotidianas de los hablantes sobre la base de sus producciones reales; denominada Análisis Conversacional. Los empleados que han transcrito las conversaciones de Google son herederos –seguramente inconscientes, puesto que a los expertos en Inteligencia Artificial les cuesta aceptar cualquier deuda con los lingüistas– de aquellos.Lingüística e Idiomas en la UPEA

Una de las primeras cuestiones que se planteó esta nueva disciplina fue cómo pasar al papel una conversación de modo que reflejara las particularidades del habla y no fuera un calco de las convenciones de la lengua escrita. Pongamos un ejemplo; así es como aparece un diálogo en El Jarama, una novela que buscaba reproducir de forma realista el habla cotidiana:

–Anda, cuéntame algo. Tito.
–Que te cuente, ¿el qué?
–Hombre, algo, lo que se te ocurra, mentiras, da igual. Algo que sea interesante.
–¿Interesante? Yo no sé contar nada, qué ocurrencia. ¿De qué tipo? ¿Qué es lo interesante para ti, vamos a ver?
–Tipo aventuras, por ejemplo, tipo amor.

Y así es como se representa una conversación coloquial:

A: habláis poco ¿eh?

C: ¿para qué?§

B:                      § ¿qué quieres que hablemos↓ nano↑?

D: toma

B: ¿situación coyuntural↑ oo la política estructural↓?

A: de vuestras cosas

B: puees ayer me tiré a dos chinos↓ nano§

A:                                                                          § a dos negros↓ dirías

B: ¡yee pasa las papas! → ¡hostia↑! medio paquete os habéis hecho ya↓ cabrones → déjame coger§

D:                                                                                                                                                                § medio paqu– noo de eso no se llena (8”) [dame cocacola]

(Briz y Grupo Val.Es.Co. 2002)

Posiblemente al lector le haya costado más esfuerzo leer el segundo fragmento que el primero. También es posible que le parezca que la conversación no tiene sentido o que estos cuatro hablantes hablan mal. Sin embargo, se trata de estudiantes universitarios convertidos hoy en día en profesionales liberales respetables. Puedo asegurarle al lector que, si se grabara a sí mismo, tendría la misma impresión. Las conversaciones siguen reglas de construcción que la sintaxis que nos enseñaron en la escuela no puede explicar, y deben de ser conocidas por todos porque ningún hablante se ha quejado, hasta el momento, de no entender una conversación con amigos o con su familia. Y sin embargo, poner en forma de reglas dicho saber es una tarea en la que muchos lingüistas estamos implicados y que solo poco a poco se va desvelando.

Este empeño investigador no es una muestra de la inutilidad de las Humanidades, como pudiera pensarse, si hasta el todopoderoso Google se ha sumado a nosotros en esta misma tarea: el que consiga desentrañar las claves de los mecanismos de la conversación producirá un avance enorme para el reconocimiento automático del habla y para que las máquinas hablen, realmente, como los seres humanos.

_

Publicar un comentario

0 Comentarios