• Big Data: Mitos vs realidad

    Fecha: noviembre 4, 2021

    Categoría: Datos y métricas

    El fenómeno del big data (entendido como la capacidad para generar, registrar, procesar, analizar y obtener información inteligente a partir de una ingente cantidad de datos) está marcando un antes y un después en muchos aspectos de la vida y podría ser equivalente a la revolución que supuso el desarrollo de Internet. Ningún área de negocio o segmento de nuestra vida va a quedar fuera del alcance del big data y su explotación, por ejemplo, por parte de la inteligencia artificial. No son pocas las voces autorizadas que defienden que el resultado de esta pandemia hubiera sido diferente de haber dispuesto de mejores datos para analizar.

    Hagámonos una idea de la dimensión de lo que estamos hablando. Ya en 2012 – hace prácticamente 10 años – el gigante IBM afirmaba que si todos los bytes de datos que generábamos anualmente fueran guardados en CDs y los apiláramos, crearíamos una gran torre de ida y vuelta desde la Tierra hasta la Luna. Desde ese momento, el incremento de datos ha sido exponencial. 

    Y es que las ciudades están plagadas de sensores que recogen información meteorológica, tráfico, transacciones financieras, nuestra huella en Internet, en redes sociales, en las compras, en el consumo de contenidos, en cómo viajamos, nuestra salud… Somos los usuarios y ciudadanos anónimos los que vamos dejando un impresionante rastro de datos, no solo de lo que hacemos, sino también de lo que pensamos e, incluso, de cómo nos sentimos. 

    Los datos como moneda de cambio

    Los datos son la nueva moneda de cambio. Son el nuevo poder. Hace unos años, grupos terroristas de oriente descubrieron la ubicación de las bases militares americanas en la zona a partir del acceso a los datos generados por los wearables de los soldados americanos… y, sin embargo, compartimos nuestros datos sin pensarlo dos veces. 

    Odiamos estar metiendo nuestra contraseña constantemente por lo que nos “logamos” en páginas “desconocidas” usando nuestras RRSS con aplicaciones como Facebook o Google. Como consumidores e individuos, nuestras vidas —nuestras preferencias, pasiones y prejuicios— están encapsuladas en muchos terabytes de datos, en la nube: desde nuestro historial de compras en Amazon, pasando por lo que nos gusta en Facebook e Instagram, hasta nuestras opiniones en Twitter, quiénes son nuestros amigos o familiares, a lo que buscamos en Google y lo que le preguntamos a Alexa o a Siri.

    Para capitalizar esta oportunidad desde las marcas y las empresas, se requiere entender qué es y qué no es el big data y cómo podemos aplicarlo a nuestro trabajo. A continuación, exploramos siete mitos frente a otras tantas realidades en torno al big data:

    Mito 1: TODO EL MUNDO LO USA

    Las empresas que realmente están usando su big data son muy pocas. Hay numerosos altos directivos que están muy interesados en lo que puede ofrecer, pero a la hora de la verdad, les cuesta dar el paso hacia una verdadera transformación digital por el ‘miedo’ inherente al cambio. No está tan extendido un uso estratégico del big data y, por supuesto, mucho menos en el ámbito de la comunicación y el marketing.

    Según el informe “Madurez digital en España. Datos y Analítica” de la filial de Indra, Minsait, apenas un 17% de las empresas en nuestro país contaban con especialistas en analítica de datos a finales de 2019.

    Mito 2: MÁS DATOS = MEJORES DATOS

    Cuando la gente habla del big data, la conversación habitualmente va sobre la cantidad de datos y cómo esta cantidad crece. El tamaño y la velocidad parecen lo más importante. Realmente, el tamaño no es tan relevante porque, de hecho, un porcentaje muy reducido de todos los datos disponibles son los que se aprovechan actualmente de verdad.

    Lo más relevante es la calidad de los datos. Lo que hace realmente útil el big data son las conocidas como 5 V’s:

    • Volumen – ¿De cuántos datos disponemos?
    • Variedad – ¿En qué formatos y con qué variedad de fuentes disponemos de la información?
    • Velocidad – La velocidad a la que se generan los nuevos datos y se añaden a los existentes. También la velocidad en la que podemos analizarlos, si es en tiempo real, por ejemplo.
    • Veracidad – La calidad y veracidad de los datos que poseemos. El grado de confianza.
    • Valor – El valor que nos aportan a través de su análisis.

    Mito 3: SE NECESITA MUCHO DINERO

    Es cierto que las grandes corporaciones y los gobiernos están invirtiendo grandes presupuestos en hardware, software, almacenamiento y profesionales con habilidades en estos campos pero, cada día que pasa, la tecnología big data se está abaratando y también aumenta el número de opciones de software que permite el análisis de esos datos. Cada vez más, el uso del big data se está democratizando, permitiendo que todos los actores – desde los más grandes hasta las PYMES – empiecen a desarrollar sus estrategias dirigidas por los datos.

    Mito 4: LOS LÍDERES TRIUNFAN CON HERRAMIENTAS Y TECNOLOGÍA

    Es obvio que las herramientas y la tecnología son importantes, pero no es en lo que se basa el éxito del big data. El éxito con el big data se sustenta, sobre todo, en una estructura y cultura de compañía basada en el análisis de los datos. Ser “data-driven” es más importante que tener muchos datos. Los estudios demuestran que cuanto más “data-driven” se consideran las empresas, mejor performance y resultados tienen. Tener éxito con los datos también requiere fomentar una cultura de experimentación

    Mito 5: ESTO VA DE GENTE DE IT, MATEMÁTICOS, INGENIEROS, ANALISTAS…

    Todo el mundo quiere “montar un big data”, pero muy poca gente sabe cómo estructurar este ciclo. Y, sobre todo, la gran pregunta es ¿para qué? ¿Qué queremos saber?

    El big data en sí mismo no tiene valor. La cuestión no es cuántos datos podemos tener o analizar, sino para qué queremos analizarlos, qué queremos saber y, por lo tanto, qué tipo de datos necesitaremos. Y para responder adecuadamente esto, aunque nos sorprenda, con frecuencia son necesarias mentes con un perfil más “humanista” que de “ciencias”: filósofos, sociólogos, lingüistas…

    Las habilidades que se necesitan para usar el big data son técnicas o estadísticas solo en un 50%. El otro 50% son de pensamiento lógico: saber formular buenas hipótesis basadas en lo que sabemos y en lo que queremos descubrir. El reto no recae sobre los datos, sino sobre el pensamiento analítico: la habilidad para reconocer y solventar problemas usando la información disponible.

    Mito 6: EL BIG DATA ES EL NUEVO PETRÓLEO

    Sí, efectivamente. A pesar de que el uso de los datos para obtener información no es nada nuevo en absoluto. Al igual que el petróleo, los datos no sirven para nada en crudo, hay que refinarlos y transformarlos en gasolina. También el big data es como un kilogramo de harina o de arroz. Pueden tener cierto valor, pero si no sabemos cómo usarlos para elaborar una receta, no tienen ningún valor porque no son comestibles.

    Mito 7: TODOS LOS DATOS SE PUEDEN ANALIZAR

    Hay una gran cantidad de datos que no se pueden rastrear, ni medir, ni analizar. Es el llamado “dark social”: por ejemplo, todas esas visitas a un sitio web cuya procedencia se desconoce. O todas las ocasiones en que compartimos información vía correo electrónico o mensajería instantánea como Whatsapp, Snapchat o Messenger. Este tráfico de datos es difícil de medir y esencialmente casi invisible para la mayoría de programas analíticos. Varios estudios aseguran que el “dark social” supone, al menos, un 50% del tráfico de cualquier web.

  • La inteligencia artificial va a resultar aún más transformadora para la comunicación en los próximos cinco años, que lo que las redes sociales han sido en el último lustro. El big data seguirá experimentando un gran crecimiento debido a desarrollos como el de la inteligencia artificial y el ‘machine learning’ que ayudan al progreso en el análisis y aprendizaje a partir de datos, o a la penetración del Internet de las Cosas (IoT) que genera nuevas fuentes y un mayor volumen de datos. Para 2025 se dice que habrá en el mundo más de 50.000 millones de dispositivos ‘Smart’ conectados a internet. ¿Servirá todo ello para predecir y minimizar el impacto de pandemias como la que estamos sufriendo?

    Para capitalizar esta oportunidad desde las marcas y las empresas, se requiere entender hacia dónde vamos con el desarrollo del big data y cómo podemos aplicarlo a nuestro trabajo. A continuación destacamos las 7 principales tendencias que no debemos dejar pasar:

    TENDENCIA 1 – Del Social Listening al Conversation Analysis

    El ‘social listening’ apenas roza de pasada el potencial de la analítica. Es más interesante cuando sabemos cómo recoger y procesar los datos de una forma más esclarecedora. Se trata del ‘conversation analysis’ un paso más allá que, con las nuevas herramientas disponibles, nos permite identificar correlaciones e insights que antes ni en sueños se nos ocurrirían. Este análisis más profundo (con plataformas como Watson de IBM o Graphext, por ejemplo) nos brinda aún más posibilidades.

    TENDENCIA 2 – El reto de la privacidad de los datos

    La tecnología y la realidad van por delante del regulador. Y cuando éste actúa, además de tarde, no lo hace de forma homogénea en los diferentes países. Hace falta, por lo tanto, incrementar la seguridad jurídica para los operadores y empresas de datos.

    Es necesario hacer convivir las dos caras de una misma moneda: la RECOGIDA, TRATAMIENTO y COMERCIALIZACIÓN… de los datos, con los derechos a la PRIVACIDAD, SEGURIDAD y ACCESO… de los ciudadanos a sus datos.

    Las personas anónimas somos las que construimos el cotizadísimo big data a fuerza de hacer transacciones, escuchar música o geo-localizarnos cuando hacemos una foto. Incluso los que no tienen Facebook están también en Facebook, y los que nunca usan internet pueden aparecer en una búsqueda de Google.

    TENDENCIA 3 – El big data mal utilizado puede ser un arma de destrucción matemática

    Así es como titulaba la revista Yorokobu un artículo en el que entrevistaba a la antigua analista de datos en Wall Street, Cathy O’Neil. Según esta experta, “los grandes bancos y aseguradoras están utilizando el big data para valorar, calcular, aprobar y rechazar los créditos o las pólizas de sus clientes, incluidas las pólizas médicas. Los clientes, muchas veces, no sabemos ni qué criterios se están utilizando para evaluarlos, ni si los datos son privados y han sido obtenidos sin nuestro consentimiento, ni si son incorrectos y las empresas no les dan, por eso mismo, el trato que merecen”.

    Algo similar ha empezado a ocurrir también con los departamentos de recursos humanos que ya utilizan estos sistemas para filtrar a los candidatos de los procesos de selección y para medir el talento, la capacidad o la proyección de los trabajadores internos.¿Serán los algoritmos o los robots con inteligencia artificial los que evitarán la discriminación por razones de sexo, raza, edad u otras circunstancias?

    TENDENCIA 4 – La IA es lo más parecido a un humano

    La inteligencia artificial ha creado asistentes digitales que serán millones de veces más inteligentes que los humanos. IBM lleva más de una década entrenando a IBM Watson, un sistema de inteligencia artificial que puede procesar cientos de millones de datos y hacer un análisis de toda esa información en apenas unos segundos. Este sistema aprende constantemente de los humanos que le rodean cada vez que es utilizado por las empresas. Aprende de nuestras respuestas, de nuestras inquietudes, de nuestras reacciones y de la forma en la que nos expresamos, con nuestros matices y giros lingüísticos.

    Esto es un cambio muy significativo en la relación hombre-máquina porque hasta ahora la conversación entre las personas y las máquinas había sido al revés. Los individuos tenían que pensar en una lógica distinta a la suya: una lógica de aparato. Los humanos se vieron obligados a suplantar sus manos por teclados y ratones, a usar comandos en vez de palabras y a sustituir su voz por pulsaciones sobre botones. Ahora es la máquina la que aprende un comportamiento humano.

    Ya se está utilizando en medicina, banca, industrias energéticas, instituciones científicas y universidades… entre otros muchos ámbitos. Entre otras aplicaciones, se usa para crear los famosos ‘chatbots’, sistemas de atención al cliente – por ejemplo – en los que, al principio, el ser humano enriquece la información y, luego, es el software como IBM Watson el que aprende del análisis de su interacción con los humanos.

    Millones de usuarios en el mundo utilizan ya estos asistentes virtuales y se están convirtiendo en una de las principales herramientas de captación de información. De hecho, algunos estudios revelan que el 80% de los millennials prefieren compartir su información personal con un bot antes que con un humano. A medida que la inteligencia artificial vaya alcanzando nuevas fronteras, se logrará que las respuestas que den estos chats sean mejores y más “humanas”, lo que mejorará aún más la experiencia del cliente. A medio plazo, se estima que entre el 40% y el 70% de las interacciones en call centers o SAC serán totalmente automatizadas.

    TENDENCIA 5 ¿Pone la automatización a muchas profesiones en peligro de extinción?

    Todo esto está suponiendo una auténtica revolución en el ámbito laboral. Ya en 2017, el diario ABC publicaba que la consultora Gartner había llevado a cabo un estudio según el cual la inteligencia artificial crearía hasta el 2020 más trabajos de los que destruiría. 2,3 millones de nuevos empleos frente 1,8 millones de empleos destruidos. No sabemos si esta previsión se habrá cumplido, pero el análisis también detallaba que, a partir del 2020 y hasta 2025, se crearían dos millones más. Lo más interesante de este informe es que afirmaba que para 2022, el trabajo de una de cada cinco personas estaría relacionado con la inteligencia artificial. Y todo ello sin contar con la aceleración de la transformación digital y del análisis de datos que va a suponer la pandemia que estamos viviendo.

    Algunas profesiones que se verían afectadas podrían ser:

    • La MEDICINA: Según la Sociedad Española de Radiología Médica, el empleo de 9.000 radiólogos en España podría estar en peligro. Las pruebas médicas realizadas con IA mejoran hasta un 20% los diagnósticos.
    • Los trabajadores de BANCOS, TIENDAS o SUPERMERCADOS: Ya existen dispensadores inteligentes con reconocimiento de voz incorporado que pueden sustituir perfectamente a los cajeros o cajeras humanos.
    • La ABOGACÍA: Los grandes despachos están aplicando ya IA para el análisis de jurisprudencia, lo que reduce tanto la duración de los casos, como el número de personas implicadas.
    • El PERIODISMO: Se pueden ya desarrollar contenidos perfectamente redactados en tiempo real a partir de potentes motores que identifican los intereses de la audiencia y los datos de los acontecimientos. En Samy, hemos sido testigo de algunas pruebas como las que realizan en la empresa española Leo y es realmente difícil diferenciar los contenidos creados por un robot, de los redactados por un humano.
    • Incluso la COMPRA DE MEDIOS se verá muy afectada: Volkswagen ya comenzó a planificar los medios para comprar en sus campañas publicitarias utilizando software de inteligencia artificial, aumentando su efectividad y, por lo tanto, aumentando sus presupuestos al hacerlos más eficientes. Ha llegado a prescindir de su agencia de medios.

    TENDENCIA 6 – People Based Marketing

    Desde hace unos años, las marcas cambian sus “audiencias” por “personas”. Con el fin de que la publicidad sea menos invasiva, se trata de hacer que la comunicación de las marcas con los consumidores sea para estos lo más relevante posible, proporcionándoles información en la que de verdad estén interesados.

    Se trata de impactar solo a las personas interesadas en un producto o servicio y en el momento en el que estén interesadas. El problema es que seguimos recibiendo en Internet, por ejemplo, publicidad del producto que hemos buscado en Google o en Amazon y que ya compramos hace un mes… Pero la tecnología y la analítica se van afinando y están consiguiendo que la publicidad y la comunicación sean cada vez más efectivas.

    Aun así, no hemos conseguido eliminar la táctica de disparar a cañonazos con interminables bloques publicitarios de spots en televisión y no siempre somos capaces de cumplir la promesa de hacer de la publicidad información relevante para el consumidor. Son precisamente las grandes compañías que manejan sus propios datos de comportamiento de los usuarios (Amazon, Google, Facebook…) junto con las que usan el big data de forma inteligente, las que más rápido avanzan en este camino.

    TENDENCIA 7 – Prediciendo el futuro

    La ANALÍTICA es la verdadera herramienta que saca partido al big data. Y hay, al menos, tres tipos de analítica. La tendencia de futuro es hacia una analítica PREDICTIVA: esto es, anticiparnos con el big data al futuro. Estudiando datos recientes y pasados, se puede llegar a predecir qué ocurrirá en un porcentaje de acierto significativamente alto.

    Los motores de búsqueda, por ejemplo, tienen tanta información de los usuarios, que únicamente necesitan desarrollar y aplicar las tecnologías ya existentes para anticiparse a las necesidades de estos usuarios. Incluso en aspectos que ni el propio usuario había contemplado. Así es como compañías ‘data-driven’ como Amazon organizan ya sus operaciones logísticas para tener cerca de nuestros domicilios y entregarnos en apenas dos horas aquello que “saben” que pronto vamos a comprar.