“Déu no juga als daus amb l’univers”, és una de les cites més famoses d’Albert Einstein.
Einstein feia referència a la mecànica quàntica, branca de la física que estudia el comportament de les partícules molt petites (a nivell atòmic i subatòmic), i que mai no va arribar a acceptar. El més sorprenent de la mecànica quàntica és que proposa que a nivell atòmic tot es regeix per probabilitats; no és possible calcular amb certesa cap estat.
I aquest és un plantejament totalment oposat al de la mecànica clàssica, que és determinista. És a dir, sosté que, si es tenen totes les dades i es coneixen les lleis que el regeixen, qualsevol resultat és mesurable i predictible. Per a tot resultat hi ha prèviament una causa explicable (causa-efecte). Un exemple és la fórmula de la segona Llei de Newton, que tots coneixem: Força = Massa x Acceleració.
La informàtica “tradicional” es basa en aquest determinisme. Si coneixes les regles (lleis o fórmules), les pots escriure en codi informàtic. El que s’anomena un algorisme. I, si teniu totes les dades que necessiteu l’algoritme, el que es coneix com a variables, pots calcular un resultat de manera precisa. Sense lloc a l’error.
Font imatge: Fisimat
És el que van utilitzar a les olimpíades de Tòquio 2020 per programar un robot que llançava tirs de bàsquet. Va encistellar 2020 vegades seguides. Ni una sola fallada. Al cap i a la fi, la fórmula del tir parabòlic és ben coneguda (Lleis de Newton). No és fàcil fer els càlculs perquè hi intervenen moltes variables. A més de les conegudes i fixes com l’alçada i distància de la cistella, també influeixen la gravetat (que depèn de l’altitud), densitat de l’aire, pressió atmosfèrica, fregament de l’aire, pes i forma de la pilota, i fins i tot la rotació de la Terra, entre d’altres.
Què passa si no tenim totes variables, o no en coneixem la fórmula?
És llavors quan entra en joc la intel·ligència artificial (AI), i igual que amb la mecànica quàntica, al màxim que podem aspirar és a calcular la probabilitat que un fet passi. És el que passa quan volem predir el comportament dels nostres clients. No hi ha una regla per endevinar-ho amb exactitud. Però el que sí que tenim són moltes dades sobre el comportament d’altres clients en el passat. Tenim les dades, però desconeixem la fórmula.
Utilitzant la intel·ligència artificial podem intentar esbrinar la regla. Tot i que, al final, al màxim que arribarem és a una aproximació, a una probabilitat.
Com es fa?
Als models d’AI no supervisats, una de les tècniques fetes servir és la del Clustering. Agrupem les dades en conjunts de manera aleatòria, i estudiem aquests grups per identificar algun “senyal” (insight) que tingui sentit. En què s’assemblen les dades d’un mateix grup? En què es diferencien de les de l’altre grup? I si no trobem una relació o sentit (un patró). Aleshores llançarem els daus una altra vegada.
És a dir, tornarem a agrupar aleatòriament les dades en conjunts, i una altra vegada les analitzarem. I així, repetirem agrupant aleatòriament (llançant els daus) fins que descobrim algun tipus de regla, relació o patró entre els grups.
Aquesta tècnica d’AI no supervisada és utilitzada per les empreses, per exemple, per poder crear millors perfils dels clients i els seus hàbits de compra, i així poder enviar missatges comercials més personalitzats que millorin la probabilitat de compra.
És el cas de les recomanacions de productes. Amb els milers i milers de dades que tenen dels clients i les seves compres anteriors la intel·ligència artificial les va agrupant fins que aconsegueix una “possible” relació entre 2 diferents grups. Simplificant molt, un cas seria el d’un grup A format per clients que compren material esportiu de gamma mitjana-alta, i consumeixen suplements nutricionals. I, per altra banda, tindríem el “grup B” format per clients que compren menjar bio, i consumeixen tractaments de benestar i salut.
És possible analitzar semànticament els dos tipus de consums i arribar a la conclusió que ambdós grups, encara que compren diferents productes, tenen interessos comuns relatius a la salut, per la qual cosa els productes i serveis que compra un grup tenen més probabilitat (no certesa) de que siguin d’interès també per a l’altre grup.
No cal dir, que a la realitat, aquestes anàlisis són molt més complexes, amb més grups i més variables.
L’AI no supervisada és utilitzada també per a altres usos, com per exemple la detecció de fraus. La lògica és similar, segmentar els clients en grups diferents i identificar algun tipus de regla entre ells. En aquest cas, seria detectar una diferència de comportament entre el grup que realitza un ús correcte de la targeta de crèdit, i un altre grup en què l’ús de la targeta està fora del que és habitual i, per això, sorgeix la sospita que hi ha un frau en curs.
A la computació “tradicional” coneixem les regles i tenim totes les dades, i obtenim resultats precisos. La intel·ligència artificial la fem servir quan no tenim totes les dades, o no coneixem les regles (o només part), i el resultat que aconseguirem és sempre una predicció, és a dir, la probabilitat que passi alguna cosa, però mai una seguretat.