I bilanci di fine anno hanno un po’ stufato, anche perché alla fine han ragione quelli per cui l’anno inizia il primo settembre e termina l’ultimo di agosto. Invece, le verifiche.
Tale jerpint, persona all’altezza di cimentarsi con Advent of Code, ha sottoposto gli stessi identici problemi ai migliori assistenti generativi.
Risultato: la performance dell’umano, nel caso più favorevole agli LLM, è stata fare il cento percento meglio. Considerazione:
Questi modelli sono molto bravi nell’usare schemi di problemi da applicare a problemi che già conoscono, ma sono scarsi nel risolvere problemi mai visti prima.
Nel definire un’entità intelligenza, si tratta di un’osservazione che dovrebbe avere qualche peso. Considerazione finale:
È da notare che ho eseguito i prompt dei problemi il ventisei dicembre, quando c’erano praticamente zero possibilità che i modelli fossero giò stati addestrati sui problemi. Sospetto che la loro capacità di risolverli aumenterà nel tempo…
Auguro a tutti un 2025 nel quale lasceremo parlare di intelligenza artificiale alle sciampiste, con tutto il rispetto, mentre noi useremo termini più appropriati.