Un grupo de investigadores de la Universidad Estatal de Pensilvania (Estados Unidos) ha descubierto una forma inquietante de vulnerar la privacidad de las personas mientras están hablando por teléfono. Utilizando un radar de ondas milimétricas, junto a un sistema de reconocimiento de voz basado en inteligencia artificial, han logrado captar y transcribir conversaciones telefónicas desde tres metros de distancia, con una precisión aproximada del 60%.

Pero, ¿cómo funciona esta alarmante técnica? Un radar de ondas milimétricas detecta las vibraciones del altavoz del auricular del teléfono durante una llamada, incluso cuando el sonido es inaudible para humanos y micrófonos convencionales. Y luego, un modelo de reconocimiento de voz —basado en la tecnología Whisper de código abierto— es adaptado para procesar las señales captadas por el radar, mediante una técnica llamada ‘adaptación de bajo rango’.

El resultado es bastante sorprendente, puesto a que, incluso con errores en el procesamiento de señales, la técnica puede transcribir las llamadas con un 60% de precisión en un vocabulario de 10.000 palabras. Además, si bien dicha técnica está lejos de ser perfecta, los investigadores han detectado que dicho sistema puede tener serias implicaciones de seguridad, ya que puede revelar información sensible.

Por otro lado, según informa el diario Interesting Engineering, esta técnica se basa en un proyecto de 2022, en el que el grupo de investigadores logró hasta un 83% de precisión al reconocer diez palabras predefinidas utilizando un enfoque similar.

Esta técnica es similar a leer los labios

El grupo de investigadores explica que este método es parecido a leer los labios, es decir, aunque solo logres captar entre un 30% y un 40% de las palabras, con el contexto adecuado, es posible reconstruir gran parte de la conversación. Además, de la misma forma, los resultados del sistema, aunque no sean precisos al 100%, pueden destapar información sensible si se combinan con datos previos o con una revisión manual.

Por otra parte, el autor Suryoday Basak revela a Interesting Engineering los riesgos potenciales que plantea esta tecnología: «De manera similar a cómo los lectores de labios pueden usar información limitada para interpretar conversaciones, el resultado de nuestro modelo permite inferir partes de una conversación telefónica a unos pocos metros de distancia«.

Además, añade que el objetivo de esta técnica consiste en explorar si estas herramientas pueden ser utilizadas por actores maliciosos para espiar conversaciones telefónicas a distancia: «Nuestros hallazgos sugieren que esto es técnicamente factible en ciertas circunstancias, y esperamos que esto concientice al público para que las personas sean más conscientes durante las llamadas sensibles».

No obstante, de cara a un futuro, se prevén esfuerzos para desarrollar medidas de protección para asegurar las conversaciones personales frente a este tipo de vigilancia remota.

