A 103 días del plebiscito de salida, el Servel no ha cuantificado las descargas del archivo que publicó en su web con datos sensibles de los 15 millones de votantes que componían el padrón de la elección de mayo de 2021. El organismo solo contabilizó 116 visitas al lugar donde estaba el link que al menos por 22 horas expuso dos informaciones reservadas a las que se puede sacar provecho en campaña: si el elector concurrió o no a votar en mayo del año pasado y si es militante. Expertos proyectan de qué manera podrían utilizarse estos datos en la campaña del plebiscito. Al menos son seis los cruces con otras bases de datos comerciales que ya se venden en el mercado informal o de fuentes abiertas (como perfiles de Facebook), que permitirían georreferenciar manzanas e identificar familias donde las campañas serían más efectivas.
Son 116 las personas que accedieron al link que se publicó en la web del Servicio Electoral (Servel) y que estuvo disponible al menos por 22 horas entre el miércoles 27 y el jueves 28 de abril pasados. Así lo confirmó a CIPER el organismo -cuya versión indica que esa filtración se produjo por error y existe una causa penal y un sumario en curso-, afirmando además que todavía no poseen listas de IP o Dirección de Protocolo de Internet (Internet Protocol Address) para determinar quiénes descargaron la planilla con datos sensibles de 15 millones de personas correspondientes al padrón electoral de las elecciones municipales, de convencionales y gobernadores regionales que se realizaron los días 15 y 16 de mayo del año pasado.
Quienes trabajan en ingeniería de datos con fines electorales o “ingeniería electoral”, consideran que la información publicada, que dejó a disposición los RUT de los electores, su militancia política, domicilio y si votó o no en la elección de mayo de 2021, no solo es un escándalo todavía sin responsables, sino también una herramienta de campaña que puede incidir de manera clave en el próximo plebiscito de salida.
CIPER consultó a distintos especialistas cómo estos datos publicados por el Servel podrían ser utilizados en los comandos del Apruebo y Rechazo. La lista la componen el cientista político y académico de la Universidad Mayor, José Miguel Cabezas, quien fue la persona que solicitó vía Ley de Transparencia los datos de participación electoral al Servel y que recibió el link con la información sin anonimizar que alertó sobre la fuga de datos; Antonio Díaz-Araujo, socio y gerente general de la empresa especializada en ciencia de datos Unholster; la académica Magdalena Bennett del grupo de estadística de la escuela de negocios de la Universidad de Texas, en Austin; Ricardo Baeza-Yates, director de investigación del Instituto de IA Experiencial de Northeastern University, profesor de la Universidad de Chile e investigador del Instituto Milenio de Fundamentos de los Datos; el director del Centro de Estudios y Encuestas Tú Influyes, Axel Callis; y la fundadora de Datos Protegidos, la abogada Jessica Matus Arenas.
Junto a la nómina anterior y a especialistas en despliegue de campañas territoriales y digitales, y en elaboración de encuestas de campaña, detectamos al menos siete ventajas que puede obtener un comando electoral si la información sensible difundida por el Servel se cruza con otras bases de datos, como perfiles en redes sociales.
Aunque con matices, los expertos y académicos coinciden en que este inusual insumo de campaña otorga algo apetecido: la posibilidad de georreferenciar a votantes que ya participaron del proceso eligiendo a los convencionales. Asimismo, ubicar con nombre y apellido a los votantes independientes, para así focalizar campañas vía redes sociales, presenciales o mediáticas. Pero, todos precisan que la sola base de datos que liberó por error el Servel no sirve por sí misma, sino que debe ser cruzada con otras bases de datos comerciales (adquiridas en el mercado informal) o de fuentes abiertas (como perfiles en Facebook).
El ejercicio arrojaría radiografías muy precisas del votante, el lugar dónde encontrarlo -tanto física como digitalmente-, el nivel socioeconómico al que pertenece -otorgado por el avalúo fiscal del lugar donde vive- y si es alguien con potencial interés en votar en esta elección. Incluso, Axel Callis y Antonio Díaz-Araujo, hablan de que en este cruce hasta podría estimarse en que vereda ideológica votó cada elector en la elección de mayo de 2021. Y todo eso, explican, no solo propicia el éxito de una campaña electoral, también promueve la focalización de los recursos de propaganda.
1) GEORREFERENCIAR A PERSONAS POR MILITANCIA Y PARTICIPACIÓN
Localizar en un mapa dónde viven los electores y referenciarlos por cuadras, manzanas o comunas, es un insumo de campaña utilizado ampliamente por comandos y asesores de estrategia electoral. La ingeniería de datos hasta ahora ha logrado predecir a través de probabilidades dónde podrían ubicarse las personas que tal o cual sector político anda buscando. Para ello, es necesario cruzar información con bases de datos abiertas como la información que ofrece la Comisión Para el Mercado Financiero, la Encuesta Casen o el propio Servicio de Impuestos Internos, o bien, adquirir bases que contienen listados de cotizantes en AFP o clientes de farmacias, las que se comercializan en el mercado informal. Esos datos arrojan mapas donde probablemente podría concentrarse el trabajo de brigadistas, la repartición de papelería de campaña y hasta el despliegue de candidatos que buscan el voto puerta a puerta.
Pero ahora, con la descarga de datos que incluye RUT y militancia, el esfuerzo se simplifica y los comandos que antes inferían o apostaban a localizar votantes, tendrán la posibilidad de desplegar campañas específicas en virtud de la militancia.
La combinación de datos sobre militancia con participación -que es lo que había en la información filtrada- según las fuentes consultadas robustece la elaboración de los mapas que ahora podrían, por ejemplo, ubicar a grupos familiares donde solo uno o algunos de ellos fueron a votar y el resto no. Y pese a que la abstención es casi igual que la participación -y por tanto el despliegue de campaña se enfoca en quienes votan- también ayuda con exactitud a localizar a militantes o cercanos a militantes que no fueron a votar e intentar convencerlos, apuntando por ejemplo a votantes jóvenes para quienes se elaboraría un mensaje específico.
Pero entre quienes votan en una elección, las personas independientes son mayoría. A febrero de 2022, solo 5,6% del padrón electoral, es decir, 434 mil personas militaban en un partido político. Por eso, para los comandos de campaña la búsqueda de los independientes es el objetivo principal. Según explican los expertos, poder ubicarlos con las particularidades necesarias como para focalizar el mensaje, es una ayuda invaluable. Cruzar identidades con gustos personales extraídos del rastreo de las redes sociales de esas personas, o identificar los estratos socioeconómicos al que pertenecen según la búsqueda del avalúo fiscal de la propiedad dónde viven o tienen como patrimonio, permitiría a los comandos de campaña dirigir mensajes específicos con mayor certeza de éxito.
El académico José Miguel Cabezas hace hincapié en que la información reservada difundida por el Servel debe cruzarse con otras bases de datos: «Con los datos que no debieran haberse filtrado, uno puede identificar a las personas según su militancia política o no. Pero con otra información que es paralela, al empalmar bases de datos, se pueden ver más aproximaciones”, dice.
La focalización del esfuerzo acarrea, además, un ahorro de recursos económicos significativo. Antonio Díaz-Araujo lo explica con el siguiente ejemplo: si un candidato antes enviaba 350 cartas a potenciales electores de una mesa de votación a través de Correos de Chile, cuyo costo entre comunas de Ñuñoa a La Reina es de $720 según el precio más económico que ofrece Correos de Chile, ahora los comandos tendrán la opción de focalizar su esfuerzo en las personas que ya votaron en la elección de mayo de 2021. El ingeniero explica que entonces no sería necesario contactar a los 350, sino a los 70 que votaron: “De gastar $250 mil para contactar a 350 personas que no sé si votaron, ahora me gasto $50 mil para hablarle a personas que sí lo hicieron”, estima.
En eso coincide con Ricardo Baeza-Yates, quien hace ver que además uno puede saber cuántos votos necesita: “Uno podría hacer ingeniería electoral y ver cuántas personas necesitas para ganar una elección. Uno puede decir: mira, aquí la diferencia fue de 100 personas, entonces tengo que conseguir 100 personas o más que voten así ahora. Ya sabes qué esfuerzo tienes que hacer y puedes focalizar tus recursos”.
De eso mismo habla Magdalena Bennett: “Dado que la información ya se filtró y mucha gente tiene acceso a ella, las distintas campañas podrían estar georreferenciando ahora a sus potenciales votantes: por ejemplo, a no votantes que podrían transformar a votantes, mandando propaganda personalizada, o también a los que creen que muy probablemente son sus votantes para asegurarse que vuelvan a ir a las urnas”.
Según información obtenida por CIPER, los precios de bases de datos comerciales se transan a partir de los $50 mil por datos de 100 a 500 personas. El valor, según las características de las personas listadas, podrían llegar hasta los $400 mil por datos comerciales de 70 mil personas segmentadas.
2) CÓMO VOTARON LOS ELECTORES DE UNA MESA ESPECÍFICA
El día en que se filtró la base de datos, el Servel explicó en un comunicado que la información no contenía datos respecto a cómo votaron los electores que participaron de la elección. Sin embargo, según expertos, esa información podría determinarse con bastante éxito si se cruzan los datos de esta filtración con los resultados oficiales por mesa que dejó la elección de mayo de 2021. “Una empresa que hace (análisis de datos para) campañas electorales, puede ir a buscar hoy a los del Apruebo y el Rechazo”, dice Antonio Díaz-Araujo, afirmación que coincide con lo que expresa Axel Callis: “Si cruzo las votaciones por mesa, puedo saber cómo votaron los electores en un 70% a 80%, sobre todo en las mesas estibadas hacia un lugar. Puede derivar, con un porcentaje importante de probabilidad, cómo votó la persona”.
Díaz-Araujo precisa: “Es muy distinto saber, sin RUT ni nombres, que de los 350 posibles votantes de esa mesa, votaron 70, y que nueve de cada 10 votaron por el candidato ‘A’. Distinto es ahora que sé quiénes votaron y con un poquito más de información, de redes sociales de esas personas, por ejemplo, te puedo decir por quienes votaron esos 9 de cada 10. Puedo saber de qué coalición o sector. Es cierto que no se violó el secreto del voto (con la filtración del Servel), porque no sé por quién votaste explícitamente, pero tengo una tendencia bien clara de esos votos. Y eso no lo tenías antes”.
«Lo que está en juego es la democracia finalmente», agrega Jessica Matus Arenas, «porque ya sabemos todos los cruces de datos que se pueden hacer con los datos de las personas», puntualiza.
3) MAYOR PRECISIÓN EN LAS ENCUESTAS
A juicio de los especialistas consultados por CIPER, los encuestadores electorales cuentan ahora con un insumo que permitiría saber si el sujeto vota o no en las elecciones. Encuestar de manera preferente a quienes tienen un historial de participación electoral, es un insumo concreto para una campaña.
«Pasas de una teoría del probable votante a saber que efectivamente alguien vota (…). No necesitas que esa persona te diga la verdad o no, porque tú sabes quién vota. No tienes que hacer un modelo que plantee si va a votar o no va a votar. Yo puedo ahora saber por comuna a quiénes preguntar, porque yo sé que han votado anteriormente. Eso ya significa una focalización de las encuestas, muchísimo más exactas, porque podría mirar con lupa ahora efectivamente quiénes votan y puedo separarlos por sector político, si son de pueblos originarios o no, por cuadras, por avalúo fiscal de sus casas, etcétera», agrega Díaz-Araujo.
Roberto Izikson, gerente de Asuntos Públicos y Estudios Cuantitativos de Cadem, considera que la utilidad de esta base de datos para medir audiencias en forma telefónica sirve poco. Según explica, para una encuesta presencial sí sería un insumo y coincide con que podría servir a pedido de un comando. «El modelo de votante probable es una proyección sobre el futuro y no sobre el pasado», dice. «Esta base de datos representa a la elección municipal donde votó un 40% de chilenos, en la presidencial votó un 56% de chilenos. Entonces, esa base de datos sub representa a un 16% de chilenos», agrega.
Izikson estima que en el Plebiscito de Salida podría votar más del 70%: «No soy experto en campañas, pero por ahí podría haber una mayor utilidad», dice. «Si quisieras hacer una encuesta electoral, evidentemente podría tener un interés mayor», indica, haciendo la salvedad de que se requiere hacer cruce de datos para dar con teléfonos o correos de los encuestados.
4) “ACARREO” Y “CLIENTELISMO”
La mayoría de los expertos consultados para este reportaje cree que la participación aumentará en el próximo plebiscito, dado que la votación será obligatoria. Y como los datos que se filtraron desde el Servel permiten conocer cuántas personas habitan en los domicilios de militantes e identificar con un alto grado de certeza por quién votaron los independientes, ese escenario podría reflotar el antiguo fenómeno del «acarreo electoral», que no es otra cosa más que sectores políticos que se organizan para llevar personas a votar.
En la última elección, los problemas de movilización en la Región Metropolitana para que electores llegaran a sus lugares de votación proliferaron. Facilitar transporte es un aspecto que podría definirse mucho mejor teniendo acceso a los datos que entrega la información que liberó el Servel. El acarreo podría destinarse, según las estimaciones y los cruces que haga un comando, a movilizar adherentes que por distancia no votaron en mayo de 2021.
El «acarreo» podría verse reforzado con otra dudosa herramienta política que se usa, pero no se reconoce: el clientelismo, que es la intensificación de la entrega de beneficios sociales en época de campaña, en busca de apoyo electoral. En ese sentido, los datos que salieron del Servel podrían generar un detallado mapa para saber dónde hay grupos con necesidades y que, al mismo tiempo, corresponden a bolsones de electores con un perfil cercano a la opción que promueve el comando de campaña.
Magdalena Benett explica: «Es súper complejo cuando se trabaja con datos no innominados, es decir, con los que puedes identificar a una persona. Con estos datos puedo saber específicamente quién votó y no votó, y si milita en mi lado o no, y hacer una campaña muy focalizada en aquellos que no participaron antes, llegando incluso a extremos no éticos como dar incentivos directos a personas específicas por su voto». La especialista advierte que, incluso, «puede haber castigos de ciertos lados para personas que no participaron» (ver recuadro).
5) UBICAR A INDEPENDIENTES QUE NO HAN VOTADO
Ricardo Baeza-Yates explica que, en términos de georreferenciación, esta base de datos podría servirle más al comando del Apruebo. Esto, considerando que quienes se mantienen al margen de las elecciones, es decir, personas independientes que nunca han votado, denominados por los analistas como «votantes antisistema» que robustecen las cifras de abstención, podrían esta vez participar del proceso constitucional. Y esas personas, a la hora de elegir, dice el académico, poseen una inclinación más cercana a una ideología de izquierda.
«Sale muy caro hacer campaña uno a uno, pero con esto puedo analizar qué tipo de personas no votan, que seguramente van a ser las personas que ya sabemos: jóvenes, más hombres que mujeres y que viven en zonas pobres. Pero eso corrobora qué tipo de publicidad tengo que hacer para llegar a la gente que no está votando. Yo creo que eso le convendría más a los partidos de izquierda que de derecha», afirma.
6) INDIVIDUALIZAR A PERSONAS DE PUEBLOS ORIGINARIOS QUE NO VOTARON
Un aspecto delicado de la filtración de datos del Servel, dice Axel Callis, es que se podría identificar a personas que pertenecen a pueblos originarios que votaron o decidieron no hacerlo. Esto no solo los expone, como al resto del padrón, a ser objeto de propaganda personalizada elaborada por los comandos de campaña. En el caso de aquellos que decidieron sufragar, también podrían quedar expuestos a las presiones de grupos políticos que rechazan la participar en las elecciones.
Es posible, dice Callis, que a través de esta base de datos de la elección de mayo de 2021 sea posible detectar si votantes de origen mapuche, por ejemplo, no participaron en la primera elección donde hubo listas de pueblos originarios. «Una de las cosas más delicadas es que se haya filtrado si las personas de pueblos originarios votaron o no en su elección, porque eso puede perjudicar a algunas». De «1.239.295 personas habilitadas para votar en esa elección, sólo fueron a votar 283 mil aproximadamente», agrega.
7) DISEÑO EN CAMPAÑA DIRIGIDA EN RRSS
En la elección de mayo de 2021 se gastaron más de $2.790 millones en el ítem de «propaganda en redes sociales», según la última rendición publicada por Servel. De ese total, más de $368 millones se fueron directamente a publicaciones en Facebook. La propaganda digital se ha transformado en un factor que realmente permite alcanzar a quienes no poseen una decisión de voto preconcebida antes del inicio de una campaña.
Díaz-Araujo lo resume así: «Quienes tienen estos datos (de la filtración del Servel), podrán hacer campañas más baratas, más focalizadas y personalizadas». Por eso, dice, contar con los detalles del comportamiento de una persona -otorgado por el RUT, si votó en la elección y militancia como posee la base de datos extraída del Servel- es una focalización apetecida. «Si yo sé que una persona votó por candidatos de derecha y tiene 63 años, déjame meterle mensajes sobre pensión porque está a dos años de jubilarse. O si soy un candidato del Apruebo y quiero hablar de un futuro mejor, déjame vendérselo a cabros que votaron por primera vez y tienen 18 años», agrega el socio de Unholster.
Pero, el dueño de una empresa dedicada a realizar campañas digitales y propaganda política, que trabajó en las últimas elecciones (y que pide la reserva de su identidad), no está convencido de la efectividad del uso de los datos difundidos por el Servicio Electoral, pues deben combinarse con otras bases que, a su juicio, no son de fácil acceso, como las direcciones de correo electrónico de las personas:
-Para (hacer propaganda en) redes sociales el elemento más importante es, en general, el nombre o el email de una persona. A partir de ahí se pueden ir construyendo bases de datos que sirvan para segmentar anuncios en Facebook. Pero el porcentaje de match entre un perfil de redes sociales y el correo o nombre es bajo. En redes sociales la venta de anuncios está basada en la información que el perfil le entrega a la plataforma digital, más que por información externa, con esta información el algoritmo configura la segmentación y vende esa segmentación al cliente que lo necesite.
EL RIESGO DEL CASTIGO POR IDEAS POLÍTICAS