Il Machine Learning diventa semplice
Vincere le sfide dell'Intelligenza Artificiale con una soluzione di Machine Learning dal facile sviluppo e deployment
Secondo la società di ricerca Forrester Research, "il 98% delle aziende fatica a ottenere informazioni e conoscenza dai dati raccolti; ciò è dovuto principalmente alla mancanza di competenze interne".1
Le aziende di tutto il mondo sono sempre di più focalizzate sull'utilizzo dei dati - e sull'integrazione di Intelligenza Artificiale (AI) e Machine Learning (ML) - per migliorare le loro attività. Grazie alle tecnologie di Machine Learning, è possibile migliorare e automatizzare i processi, prevedere eventi e comportamenti ed eseguire proattivamente azioni programmatiche prescrittive basate su queste previsioni.
Per esempio, utilizzando il ML e l'analisi predittiva, la tua organizzazione può identificare nuovi clienti e indirizzare una campagna di marketing su di essi, oppure definire i momenti migliori per programmare una vendita promozionale comprendendo meglio il comportamento e le preferenze dei consumatori. Se sei un operatore sanitario, la tua organizzazione può analizzare le diagnosi codificate e i dati di ricovero, trasferimento e dimissione dei pazienti per ridurre i tassi di riospedalizzazione. In poche parole, le tecnologie di ML possono far risparmiare tempo e risorse, migliorare le previsioni e permetterti di prendere decisioni migliori e ottenere risultati superiori. Tutto ciò è molto promettente, ma c'è un problema: sviluppare i modelli di ML è difficile e richiede competenze poco diffuse - e costose. Fortunatamente, gli esperti del settore stanno lavorando per rendere il ML più facile da usare sviluppando nuovi strumenti, tra cui AutoML e IntegratedML®.
IntegratedML: White Paper
Leggendo questo White Paper, scoprirai:
- Perché il ML è fondamentale per il successo della tua attività
- Come la carenza di talenti rende difficile sfruttare il ML nelle organizzazioni
- Cos'è AutoML e come può aiutarti a vincere la guerra dei talenti nelle applicazioni di Intelligenza Artificiale
- Cos'è InterSystems IntegratedML® e in che modo è stato concepito per:
- Dare la possibilità ai tuoi sviluppatori di software di elaborare modelli di ML e applicazioni abilitate al ML.
- Aumentare la produttività dei Data Scientist già preparati.
- Semplificare i processi operativi e analitici per migliorare l'esperienza dei clienti, l'efficienza operativa e la produttività.
- Migliorare l'accuratezza delle previsioni, ottenere risultati migliori e permetterti di differenziarti dai concorrenti.
Questo White Paper è una lettura rivolta a dirigenti, manager e professionisti IT, sia che tu stia cercando di estendere la produttività del tuo team di ML o che stia semplicemente iniziando a utilizzare il ML senza bisogno di assumere esperti di questo campo specifico.
Machine Learning: il valore
Come un'applicazione dell'Intelligenza Artificiale, il Machine Learning addestra una macchina ad imparare a conoscere i dati basandosi su esperienza e inferenza. Migliora continuamente i risultati senza essere specificamente programmato per farlo.
Il ML può analizzare una vasta gamma di dati e creare modelli utilizzati per soddisfare un ampio numero di requisiti analitici e operativi. Offline, i modelli di ML possono aiutare gli utenti aziendali a capire il comportamento dei clienti, oppure i problemi di efficienza dei processi, per citare solo alcune applicazioni. Quando si effettua il deployment online, o nel flusso operativo di un'azienda, il ML può migliorare visibilmente i risultati - che si tratti di consigliare il prodotto o il servizio preferito a un cliente mentre sta navigando, di avvisare proattivamente prima di effettuare una vendita se esiste il rischio elevato che il fornitore non sia in grado di consegnare, o di stabilire se una transazione possa essere fraudolenta prima di approvarla. Le attività operative di ogni reparto della tua organizzazione possono beneficiare delle tecnologie di Machine Learning, comprese le vendite e il marketing, la ricerca e lo sviluppo, l'ufficio legale, le risorse umane, il supporto clienti, lo sviluppo dei prodotti e persino il reparto finanziario. ML fornisce valore in quasi tutti i settori, e promette di diventare onnipresente con l'aumento del numero di organizzazioni che sempre di più lo utilizzeranno.
Stai già sperimentando il ML nella tua vita quotidiana: dagli assistenti personali virtuali come Amazon Alexa e Siri di Apple, ai filtri antispam e ai rilevatori di malware, all'algoritmo di Facebook per suggerire nuovi amici, ai chatbot che forniscono assistenza clienti online, alle auto intelligenti che si guidano da sole.
Machine Learning: la sfida
Il Machine Learning offre molti vantaggi, ma la domanda sorge spontanea: perché non lo stanno usando più aziende? Il motivo principale è dovuto al fatto che le tecnologie di Machine Learning sono difficili da usare e richiedono un alto livello di competenza.
Il ML richiede esperti che ne comprendano teoria, tecnologia, metodi e strumenti. Oggi, questi esperti sono pochi e molto richiesti. Per esempio, se consideriamo solo gli Stati Uniti, secondo gli ultimi dati dell'U.S. Bureau of Labor Statistics, ci sono meno di 32.000 Data Scientist in tutto il paese.2 A peggiorare la carenza di specialisti di IA e Data Scientist, molti dei talenti disponibili vengono assunti da giganti digitali come Amazon, Facebook, Google e Microsoft, che pagano stipendi da capogiro. Per le organizzazioni diventa difficile competere per queste risorse altamente specializzate e disponibili in numero limitato.
AutoML: reclutare i talenti per i progetti di IA
Automated Machine Learning (AutoML) è una nuova tecnologia in fase di crescita per le organizzazioni che cercano di espandere i loro progetti in ambito di Machine Learning e per quelle che stanno iniziando il loro viaggio in questa tecnologia proprio ora.
AutoML è un approccio relativamente nuovo alla Data Science - automatizza e semplifica la creazione di modelli di ML. Esegue il feature engineering, automatizzando il processo di trasformazione dei dati grezzi in formati adeguati per i modelli di ML. Automatizza la selezione del modello, la formazione e l'analisi dei risultati - e verifica diversi algoritmi di ML con parametri variabili per creare il modello più accurato per ogni problema specifico. Per le organizzazioni che dispongono di un team di Data Scientist, ciò automatizza gran parte dei processi manuali e di apprendimento utilizzati per costruire modelli di ML e migliora significativamente la produttività dei Data Scientist stessi, facendo risparmiare tempo e fatica.
Se nella tua azienda non vi sono specialisti di ML, eseguire il feature engineering e creare e formare modelli può essere impegnativo. Ma ora, con AutoML, la tua organizzazione non ha necessariamente bisogno di Data Scientist per creare modelli di ML utili. Puoi invece iniziare con semplici casi d'uso e AutoML, mentre simultaneamente formi gli sviluppatori affinché si occupino del processo di analisi e sviluppo del ML.
Ma oggi molti strumenti di AutoML sono limitati. Pur essendo in grado di creare modelli di ML, non forniscono alcuna funzionalità per eseguirli all'interno dei processi aziendali in tempo reale. InterSystems IntegratedML è diverso.
InterSystems IntegratedML: AutoML a una potenza superiore
InterSystems IntegratedML è una funzionalità integrata della piattaforma dati InterSystems IRIS®, un ambiente software completo per la gestione dei dati. IntegratedML offre tutte le caratteristiche e i vantaggi del tradizionale AutoML. Essendo integrato in InterSystems IRIS, permette di effettuare lo sviluppo e il deployment di applicazioni sofisticate che eseguono questi modelli in modo dinamico e fluido in risposta a eventi e transazioni in tempo reale, senza estrarre o spostare alcun modello o dato.
Si consideri ad esempio una banca che emette carte di credito e che ha bisogno di identificare il rischio di frode prima di approvare ogni transazione. Esegue un'applicazione ad alte prestazioni in tempo reale per la gestione delle carte di credito sviluppata con InterSystems IRIS, che memorizza tutti i dati demografici e finanziari di tutti i clienti e delle transazioni con carta di credito. Questa applicazione può contenere centinaia di data element per ogni transazione con carta di credito - tra cui il fatto che ogni transazione sia fraudolenta o valida.
Utilizzando IntegratedML, gli sviluppatori di applicazioni presso la banca possono creare automaticamente un modello ML per identificare le transazioni ad alto rischio sulla base di quelle passate, semplicemente selezionando il campo desiderato (ad esempio "is_fraudulent") e lasciando che IntegratedML crei il modello e i parametri più appropriati.
A differenza del tradizionale AutoML, il modello basato su IntegratedML di InterSystems può essere integrato alla perfezione nell'applicazione della carta di credito per essere eseguito in tempo reale per ogni transazione in arrivo, e l'applicazione può svolgere azioni programmatiche adeguate se il modello determina l'esistenza di un elevato rischio di frode, come impedire la transazione e chiamare e inviare messaggi al proprietario della carta.
IntegratedML rende anche più facile aggiornare i modelli mentre le applicazioni sono in produzione e vengono generati nuovi dati. Nel caso delle frodi con carta di credito, appena una modalità fraudolenta viene rilevata e impedita dall'applicazione, i criminali passano sicuramente a nuove tecniche. Poiché tutti i dati, compresi quelli più recenti, sono memorizzati all'interno della piattaforma dati, non c'è bisogno di creare estratti manuali e di trasferire i dati in ambienti diversi. La banca può invece affinare continuamente i modelli utilizzando i dati più recenti per rilevare e prevenire nuovi schemi di attacco, senza ritardi.
Con InterSystems IRIS e IntegratedML, è possibile sviluppare applicazioni che eseguono azioni programmatiche prescrittive intelligenti in risposta a eventi in tempo reale, ottenendo così un vantaggio competitivo e un notevole beneficio per l'azienda. La nostra tecnologia ti può aiutare a essere il primo a commercializzare un nuovo prodotto o servizio, il primo ad agire su un nuovo progetto e il primo a rispondere ad un cambiamento nel comportamento dei clienti.
IntegratedML: ridurre i costi dei talenti e migliorare la produttività
Con IntegratedML, uno sviluppatore - con poca o nessuna conoscenza di ML - può usare SQL per sviluppare sofisticati modelli si ML.
Ciò non vuol dire non dover mai assumere Data Scientist. Se la tua organizzazione è una grande impresa con un team di Data Scientist, IntegratedML può far risparmiare tanto tempo a loro e ai tuoi data engineer. Per esempio, una ricerca condotta nel 2018 da Kaggle ML e Data Science3 ha rilevato che i Data Scientist trascorrono quasi il 40% del tempo a raccogliere e pulire dati4 (vedi Figura 1 qui sotto). L'utilizzo di IntegratedML per la preparazione dei dati e il feature engineering può liberare il tempo dei tuoi Data Scientist, che possono così concentrarsi su compiti più importanti e a maggior valore, come l'ottimizzazione dei modelli.
Per le organizzazioni che hanno appena iniziato con il ML, InterSystems IntegratedML consente agli sviluppatori di software e agli analisti che stanno costruendo le tue applicazioni e conoscono i dati, di esplorare il ML da soli. IntegratedML automatizza il lavoro di base, come identificare i modelli più appropriati, impostare i parametri e costruire e addestrare i modelli. Accelera anche il processo di integrazione dei modelli di ML nelle applicazioni di produzione. A mano a mano che i tuoi sviluppatori aumentano le competenze e iniziano a capire il processo e i risultati, possono iniziare a modificare i parametri opzionali e a impostare i valori da soli. I Data Scientist sono anche più produttivi con IntegratedML perché possono dedicare tempo all'ottimizzazione effettiva del modello piuttosto che alla gestione dei dati, al feature engineering e alla selezione delle funzionalità.
InterSystems Integrated ML: come funziona
Con IntegratedML, l'addestramento del modello, con l'identificazione delle caratteristiche di input appropriate dai dati di origine, la messa a punto dei parametri del modello e l'esecuzione sono tutti realizzati usando pochi comandi SQL.
CREATE MODEL WillSurvive PREDICTING (Survived) FROM Titanic
Il comando CREATE MODEL imposta i metadati del modello di Machine Learning. Gli sviluppatori specificano il nome del modello (WillSurvive), il campo target da prevedere (Survived) e un set di dati da cui prelevare il campo target e tutti i campi di input del modello (Titanic). La sintassi FROM è completamente generale e può specificare qualsiasi espressione di subquery. I metadati associati a questo set di dati vengono utilizzati anche per dedurre i tipi di dati dei campi target e di input, definendo completamente il problema che il modello deve risolvere.
TRAIN MODEL WillSurvive FROM Titanic
Il comando TRAIN MODEL specifica i dati da utilizzare per il training ed esegue il motore AutoML, che prende un insieme di dati relazionali come input. Poiché la sintassi FROM è generale, lo stesso modello può essere addestrato più volte con diversi set di dati. Per esempio, potresti voler addestrare un modello relativo a una campagna di marketing su diversi segmenti di clienti, o ri-addestrare regolarmente il tuo modello, quando nuovi dati di training diventano disponibili.
Il motore AutoML si occupa automaticamente di tutte le attività di Machine Learning richieste. Identifica le possibili funzionalità rilevanti dai dati selezionati, considera i tipi di modello applicabili in base ai dati e alla definizione del problema, e sintonizza gli iper-parametri per produrre uno o più modelli eseguibili.
Gli sviluppatori possono scegliere tra diversi motori AutoML tra cui InterSystems AutoML, H2O e DataRobot Enterprise AI Platform. Tutte le opzioni del motore AutoML sono perfettamente integrate in InterSystems IRIS e sono trasparenti per gli sviluppatori.
SELECT PREDICT(WillSurvive) As Predicted FROM Titanic
SELECT PROBABILITY(WillSurvive FOR 1) FROM Titanic
Una volta formato, il modello fornisce risultati tramite una delle due funzioni scalari, PREDICT() e PROBABILITY(). PREDICT() restituisce il valore più probabile o stimato per la colonna specificata secondo quanto determinato dal modello addestrato. Per i problemi di categorizzazione, PROBABILITY() restituisce la probabilità calcolata del modello addestrato che il campo di destinazione del modello sia uguale a un valore definito dall'utente. Queste semplici funzioni scalari possono essere usate ovunque in una query e in qualsiasi combinazione con altri campi e funzioni. Una delle innovazioni fondamentali offerte da IntegratedML è quella di prendersi cura in modo trasparente della mappatura dei campi disponibili nel contesto della query specifica ai campi di input richiesti per eseguire il modello.
IntegratedML fornisce ulteriore flessibilità per gli sviluppatori, per esempio per mappare ad altre fonti di dati rispetto alla particolare tabella o query utilizzata per creare o addestrare il modello, come illustrato dal seguente esempio.
SELECT Name, PREDICT(WillSurvive WITH Sex = Geschlecht, Age = DATEDIFF(year, NOW(), Geburtsdatum), Fare = TicketPreise, Cabin = Kabine) FROM Hindenburg
La maggioranza delle soluzioni AutoML opera in un ambiente standalone con accoppiamento lento a basso throughput con piattaforme dati esterne e applicazioni, ma IntegratedML è diverso. Funziona perfettamente all'interno della piattaforma per la gestione dei dati InterSystems IRIS per accelerare e semplificare l'addestramento e l'esecuzione dei modelli di ML, e permette a questi ultimi di essere integrati nelle applicazioni InterSystems IRIS senza spostare i dati o i modelli. Questa operazionalizzazione dei modelli di ML è considerata uno dei maggiori impedimenti alla rapida adozione del ML nelle applicazioni aziendali.
InterSystems IRIS Data Platform
La tecnologia InterSystems alimenta oltre 150.000 soluzioni in tutto il mondo in numerosi settori. InterSystems IRIS Data Platform è una piattaforma software completa per la gestione dei dati costruita appositamente per accelerare e semplificare lo sviluppo di applicazioni guidate dai dati e in tempo reale. InterSystems IRIS permette agli sviluppatori di incorporare funzionalità di Analytics sofisticate - tra cui Business Intelligence, IA, ML, elaborazione del linguaggio naturale e analisi predittiva - nei processi aziendali mission-critical in tempo reale. Il motore integrato di Database transazionale-analitico ad alte prestazioni supporta contemporaneamente sia i carichi di lavoro operativi che quelli analitici su scala molto elevata.
Oltre alle sue funzionalità integrate di sviluppo ed esecuzione di Machine Learning, InterSystems IRIS consente anche:
Integrazione di dati e applicazioni - InterSystems IRIS offre una serie completa di funzionalità di integrazione e interoperabilità per pulire, trasformare e normalizzare i dati e supportare integrazioni sofisticate. Offre connettività pronta all'uso e trasformazioni di dati per una vasta gamma di pacchetti applicativi, database, standard industriali, protocolli e tecnologie per rendere più facile l'integrazione e l'analisi dei dati e costruire modelli predittivi e prescrittivi.
Inoltre, è possibile integrare l'elaborazione analitica, come query SQL, analisi predittiva, ML ed elaborazione del linguaggio naturale (NLP) in processi aziendali compositi che collegano diverse fonti di dati e applicazioni. Questi processi compositi possono snellire le operazioni e attivare avvisi senza influenzare le prestazioni dell'applicazione.
Scalabilità - InterSystems IRIS è scalabile verticalmente e orizzontalmente e altamente efficiente dal punto di vista delle risorse, il che lo rende ideale per le applicazioni che supportano tassi di ingestion molto elevati, alti livelli di carichi di lavoro analitici, molti processi aziendali concorrenti e la capacità di elaborare, archiviare e analizzare set di dati molto grandi in modo economico.
Reporting e tracciabilità - Tutti i dati (compresi i dati in transito, i metadati e i dati associati a transazioni asincrone di lunga durata) vengono automaticamente memorizzati nel database incorporato e sono disponibili per il reporting e le analisi in tempo reale. Visualizzare e diagnosticare il comportamento delle integrazioni e dei processi è più facile grazie alle funzionalità di tracciamento visivo.
Sviluppo grafico - Strumenti grafici low-code permettono agli sviluppatori di visualizzare diagrammi di processi, trasformazioni, regole e workflow all'interno dei grafici, per potersi concentrare sulle interazioni logiche tra i sistemi piuttosto che sulla scrittura del codice. I modelli grafici favoriscono la collaborazione tra le linee di business e l'IT, permettendo alla tua organizzazione di sviluppare nuove soluzioni o di modificare più velocemente le applicazioni esistenti.
Deployment - InterSystems IRIS supporta un'ampia gamma di opzioni di deployment, compresi tutti i principali cloud pubblici, cloud privati, on-premise e opzioni di deployment ibride.
Se stai cercando di aiutare i tuoi clienti con esperienze personalizzate in tempo reale, migliorare i risultati clinici per i pazienti, prevedere proattivamente le esigenze di manutenzione in anticipo sui guasti o rilevare e prevenire le frodi in tempo reale, InterSystems IRIS e IntegratedML possono aiutarti a raggiungere questi obiettivi e altri ancora.
Ulteriori informazioni su InterSystems IRIS
Conclusioni
Il Machine Learning è il futuro e ogni organizzazione che vuole essere competitiva dovrà iniziare a usarlo. Sfortunatamente, i Data Scientist sono pochi e i loro stipendi sono schizzati alle stelle, rendendo difficile per le grandi organizzazioni espandere i progetti di Machine Learning e per le piccole e medie organizzazioni iniziare ad implementarli. Innovazioni come AutoML sono utili, ma da sole non sono sufficienti.
InterSystems IntegratedML offre sofisticate funzionalità AutoML, esposte attraverso un'interfaccia SQL intuitiva, e completamente integrate all'interno di una Data Platform completa. IntegratedML facilita il deployment dei modelli ML nelle applicazioni in tempo reale e mission critical senza la necessità di spostare dati o modelli, e senza richiedere uno staff di Data Scientist. Insieme, InterSystems IRIS e IntegratedML ti permettono di creare un ciclo virtuoso di miglioramento, affinando continuamente e senza ritardi i modelli di ML in risposta ai dati di produzione più recenti.
Se disponi di un team di Data Scientist, IntegratedML ne migliorerà la produttività.
Se hai appena iniziato il viaggio nel mondo dell'Intelligenza Artificiale, IntegratedML può farti iniziare subito con il ML, senza assumere costosi esperti nel settore.
In ogni caso, IntegratedML può aiutarti a:
- Velocizzare e semplificare la creazione di modelli di ML
- Eseguire azioni programmatiche intelligenti in tempo reale
- Semplificare i processi per migliorare l'esperienza dei clienti, l'efficienza operativa e la produttività
- Migliorare l'accuratezza delle previsioni, accelerare i risultati di business e superare la concorrenza
- Sviluppare app più intelligenti in modo più veloce e facile con meno risorse
- Gestire la carenza dei talenti da assumere per i progetti di Intelligenza Artificiale
Per saperne di più su InterSystems IRIS
1 - Forrester Opportunity Snapshot. (2019) Data Insights Are Key to Differentiated Customer Experience: A Unified Data Analytics Platform Enables Timely and Contextually Relevant CX
2 -
https://www.bls.gov/ooh/computer-and-information-technology/computer-and-information-research-scientists.htm
3 -
https://www.kaggle.com/headsortails/what-we-do-in-the-kernels-a-kaggle-survey-story
4 -
https://businessoverbroadway.com/2019/02/19/how-do-data-professionals-spend-their-time-ondata-science-projects/