Cali, abril 1 de 2025. Actualizado: martes, abril 1, 2025 16:22
Las estafas bajo esta figura, están a la orden del día
Fake voice e Inteligencia Artificial: ¿la voz ha muerto?
La Comisión Federal de Comercio de los Estados Unidos publicó recientemente un informe que encendió las alarmas en el sector financiero mundial.
De acuerdo con dicha entidad, para 2023 se perdieron más de 2700 millones de dólares por cuenta de estafas mediante clonación de voz por vía de Inteligencia Artificial, una situación que parece trasladarse a otras latitudes, incluso con complejas redes trasnacionales de ciberdelincuentes que ofrecen sus servicios de hackeo de cuentas bancarias y tarjetas de crédito utilizando estas tecnologías, ya no solo en la Deep Web, sino que también, sin pudor alguno, en redes de mensajería instantánea como Telegram o WhatsApp.
De acuerdo con Emanuel Enciso Camacho, Decano de la Facultad de Comunicación, Periodismo y Artes de Uninpahu, este panorama tan solo es una pequeña radiografía de lo que hoy día las inteligencias artificiales generativas de audio pueden producir en cuestión de segundos, con tan solo unos patrones de voz de una persona, que les permita capturar el tono, el color y el timbre, entre otras cualidades, para poder desarrollar cualquier tipo de mensaje, según la complejidad en la construcción del prompt.
En Colombia, particularmente, la clonación de voz ha permeado, incluso, la esfera política desde hace algunos años; recordemos, por ejemplo, que, en octubre de 2023, en pleno cierre de campaña para las alcaldías y gobernaciones, los entonces candidatos a la Alcaldía de Cali y Bogotá, Alejandro Eder y Carlos Fernando Galán, denunciaron una supuesta clonación de su voz mediante IA, que pretendía generar una campaña de desprestigio en su contra, muy al estilo de la aclamada serie de Netflix “Black Mirror”.
Desde el campo de la locución profesional, un episodio similar lo vivió Armando Plata, actual presidente de la Asociación Colombiana de Locutores y Comunicadores (ACL), cuando su voz apareció en un video institucional de un prestigioso centro comercial de Bogotá, sin su consentimiento ni pago de regalías o reconocimiento de honorarios.
¿Muere la narrativa de la voz?
Ante ello, es inevitable preguntarse -siendo apocalípticos- si, con la emergencia de la IA, asistimos a la muerte de la potencia narrativa de la voz, o a una condición oximorónica de una voz silenciada en medio del ensordecedor ruido que producen las voces generadas por estas tecnologías.
La discusión no es para nada bizantina, pues surgen otras problemáticas sistémicas, complejas e inquietantes.
En primer lugar, es necesario hablar del patrimonio vocal de cientos de miles de profesionales de la locución, el doblaje, el periodismo y los medios de comunicación que basan no solo su sustento y el de sus familias, sino también el de sus carreras profesionales, en el ejercicio de la voz; desconocer el factor humano, estético y narrativo de estos profesionales sería, en la práctica, pensar en una comunicación sin intencionalidad, sin alma, sin aura, muy similar al sentido crítico que Theodor Adorno y Pierre Bourdieu hacían en su momento a la pérdida de las calidades artísticas y culturales que denotaba la masificación del arte y la reproductibilidad técnica de la obra.
Pero, en segundo término, también asistimos a una deshumanización de la voz, esa que hasta hace poco hacía único a cada ser humano y que se encargaba de vehiculizar las emociones, percepciones y pensamiento de cada individuo, hoy pareciera que la palabra hablada sucumbiera ante el “simulacro” de las fake voice.
En ese escenario, la voz se desterritorializa desde la noción de lo seguro para instalarse, más bien, en el terreno de lo que debe verificarse con mayor cautela.
La ley
Afortunadamente, puede existir una ‘luz’ al final del túnel, por lo menos en iniciativas de regulación, con el Conpes 4144 (Política Nacional de Inteligencia Artificial), presentado en febrero de este año, especialmente en lo que corresponde a las políticas que abordan la propiedad intelectual y la protección de datos personales relacionados con IA; sin embargo, quizá quede mucho camino por construir -muy al estilo de Bogotá por estos días-, en el que deberá legislarse con claridad los límites a la propiedad no solo de la voz, sino también de otros atributos del individuo, como su imagen, así como los alcances que podrían tener las compañías del sector de producción de contenidos al momento de exigir contrataciones a locutores y comunicadores bajo la modalidad de Text to Speech (TTS) – ampliamente utilizado para el desarrollo de sistemas de respuesta interactiva o asistentes virtuales -, en el entendido que este tipo de funciones podrían conducir a replicar las voces de forma ilimitada, para diferentes propósitos, con posibilidades de monetización casi infinitas para quien contrata, pero en la mayoría de ocasiones, sin las debidas compensaciones para quien prestó su mayor talento: la voz.
De igual forma , explica Emanuel Enciso Camacho, Decano de la Facultad de Comunicación, Periodismo y Artes de Uninpahu, se requiere de un ánimo autorregulatorio por parte de los diferentes sectores que conforman el ecosistema productivo de la IA; se han dado importantes progresos en materia de transparencia algorítmica, pero también se necesita de la incorporación de lo deontológico en las estructuras de aprendizaje de la IA, en las que, a partir de sus parámetros de programación, se incorporen límites a la generación de contenidos, teniendo en consideración los propósitos y la semántica que se construye desde el prompt; ya hay unos primeros avances en ello, por ejemplo, en Copilot, la IA de Microsoft, se limita la generación de contenidos, al rastrear algunas expresiones del prompt que podrían considerarse incorrectas, con sentido malicioso u objetivos tendientes al fraude, la extorsión o manipulación de información.
En el mes de los locutores, se hace más que necesario reflexionar en la potencia de la voz; su capacidad narrativa está íntimamente ligada a nuestra historia como humanidad, incluso antes de la llegada de la escritura; no se trata de ser apocalípticos o integrados frente a la IA, adaptando el célebre título académico de Umberto Eco, sino más bien es preciso, sin maniqueísmos, reflexionar sobre los escenarios posibles en los que socialmente se siga valorando y reivindicando el papel fundamental que tienen los profesionales de la voz, al tiempo que se implemente la Inteligencia Artificial, de manera sostenible, ética y con gobernanza, para coadyuvar en la transformación, con calidad, de los productos sonoros y sus múltiples soluciones para diversos sectores económicos, sociales, políticos y culturales.