Maskininlärning gjord enkelt
Vinn talangkriget för artificiell intelligens med en lösning för maskininlärning som är lätt att utveckla och distribuera
Enligt Forrester Research har 98 % av företagen problem med att få insikter från den data de samlar in, vilket främst beror på brist på intern expertis.1 Även om din organisation kanske kan behålla sin konkurrensfördel i dag utan dessa insikter, kan förändringstakten mot digital omvandling snart påverka din verksamhet.
Därför fokuserar organisationer överallt på att använda data - och integrera artificiell intelligens (AI) och maskininlärning (ML) - för att förbättra sin verksamhet. Med ML kan du förbättra och automatisera affärsverksamheten, förutsäga händelser och beteenden och proaktivt utföra normativa programmatiska åtgärder baserat på dessa förutsägelser.
Med hjälp av ML och prediktiv analys kan din organisation till exempel identifiera och rikta in sig på nya köpare eller identifiera de bästa tidpunkterna för att genomföra en försäljning genom att bättre förstå konsumenternas beteende och preferenser. Om du är vårdgivare kan din organisation analysera kodade diagnoser samt uppgifter om patientens intagning, överföring och utskrivning för att minska antalet återinläggningar. Enkelt uttryckt kan ML spara tid och resurser, förbättra prognoser och göra det möjligt för dig att fatta bättre beslut och uppnå bättre resultat.Det låter bra, men det finns en nackdel: Det är svårt att utveckla ML-modeller och det krävs sällsynt - och dyr - expertis.Lyckligtvis arbetar branschexperter för att göra det lättare att använda ML genom att utveckla nya verktyg, bland annat AutoML och IntegratedML
®.
Tekniköversikt IntegratedML
Genom att läsa denna teknikbeskrivning kommer du att få veta följande:
- Varför ML är avgörande för ditt företags framgång
- Hur bristen på talanger gör det svårt för organisationer att utnyttja ML
- Vad AutoML är och hur det hjälper dig att vinna kriget om AI-talanger
- Vad InterSystems IntegratedML® är och hur det är utformat för att:
- Ge dina befintliga mjukvaruutvecklare möjlighet att utveckla ML-modeller och ML-aktiverade applikationer.
- Öka produktiviteten hos utbildade dataingenjörer.
- Effektivisera operativa och analytiska processer för att förbättra kundupplevelsen, den operativa effektiviteten och produktiviteten.
- Förbättra prognosprecisionen, skapa bättre affärsresultat och göra det möjligt för dig att skilja dig från dina konkurrenter.
Den här tekniköversikten är lämplig läsning för chefer, ledare och IT-personal inom affärsverksamheten, oavsett om du vill öka produktiviteten hos ditt ML-team eller om du bara vill komma igång med ML utan att behöva anlita ML-experter.
Maskininlärning: värdet
Som en tillämpning av AI tränar ML en maskin att lära sig om data genom erfarenhet och slutsatser. Den förbättrar kontinuerligt resultaten utan att vara specifikt programmerad för det.
ML kan analysera en stor mängd data och skapa modeller som används för att uppfylla ett stort antal analytiska och operativa krav. Offline kan ML-modeller hjälpa affärsanvändare att förstå kundbeteende eller problem med processeffektivitet, för att nämna några exempel på tillämpningar. När ML används på nätet eller i det operativa flödet i ett företag kan det ge synligt förbättrade resultat - oavsett om det handlar om att rekommendera en produkt eller tjänst som kunden föredrar medan hon surfar, att proaktivt varna dig innan du gör en försäljning om det finns en hög risk att leverantören inte kan leverera, eller att avgöra om en transaktion kan vara bedräglig innan den godkänns. Alla avdelningar inom organisationen kan dra nytta av ML, inklusive försäljning och marknadsföring, forskning och utveckling, juridik, personalavdelning, kundsupport, produktutveckling och till och med ekonomi. Faktum är att ML ger värde i nästan alla branscher och kommer att bli allmänt utbrett i takt med att fler och fler organisationer tar det till sig.
Du upplever redan ML i din vardag: från virtuella personliga assistenter som Amazons Alexa och Apples Siri, till skräppostfilter och detektorer av skadlig kod, till Facebooks metod för att föreslå nya vänner och nya grupper, till chattrobotar som ger kundsupport på nätet och till smarta bilar som kör sig själva.
Maskininlärning: Utmaningen
Maskininlärning erbjuder många fördelar, men frågan är varför inte fler företag använder den? Ett viktigt skäl är att ML är svårt att använda och kräver en hög nivå av expertis.
ML kräver experter som förstår teorin, tekniken, metoderna och verktygen. I dag är dessa experter få och efterfrågade. Enligt de senaste uppgifterna från U.S. Bureau of Labor Statistics finns det totalt mindre än 32 000 dataingenjörer i USA.2 Bristen på AI-specialister och dataingenjörer förvärras av att en stor del av de tillgängliga talangerna anställs av digitala jättar som Amazon, Facebook, Google och Microsoft, som betalar svindlande höga löner. Detta gör det svårt för organisationer att konkurrera om dessa redan knappa resurser.
AutoML: Att vinna kriget om AI-talanger
Automatiserad maskininlärning (AutoML) är en växande ny teknik för organisationer som vill utöka räckvidden för sina nuvarande ML-talanger och för dem som precis har börjat sin ML-resa.
AutoML är ett relativt nytt tillvägagångssätt inom datavetenskap - den automatiserar och förenklar skapandet av ML-modeller. Den utför funktionsteknik och automatiserar processen att omvandla rådata till format som är lämpliga för ML-modeller. Den automatiserar val av modell, träning och analys av resultat - och testar olika ML-algoritmer med varierande parametrar för att skapa den mest exakta modellen för ett givet problem. För organisationer med ett team av datavetare automatiserar detta mycket av det manuella och försök och misstag-processer som används för att bygga ML-modeller och förbättrar datavetarnas produktivitet avsevärt, vilket sparar tid och ansträngning.
Om du inte redan har ML-specialister anställda kan det vara en utmaning att utföra funktionsutveckling samt skapa och träna modellerna. Men nu, med AutoML, behöver din organisation inte nödvändigtvis dataingenjörer för att skapa användbara ML-modeller. I stället kan du börja med enkla användarfall och AutoML, samtidigt som du utbildar dina utvecklare så att de kan genomföra mer av analys- och ML-utvecklingsprocessen.
Många AutoML-verktyg idag är dock begränsade. De kan visserligen skapa ML-modeller, men de erbjuder ingen funktionalitet för att köra modellerna i affärsprocesser i realtid. Det här är en viktig faktor som gör InterSystems IntegratedML annorlunda.
InterSystems IntegratedML: AutoML för mer kraft
InterSystems IntegratedML är en inbäddad funktion i InterSystems IRIS® dataplattform, en komplett mjukvarumiljö för datahantering. IntegratedML har alla funktioner och fördelar som traditionell AutoML har. Eftersom den är inbäddad i InterSystems IRIS kan du dock utveckla och distribuera sofistikerade applikationer, som sömlöst utför dessa modeller dynamiskt, som svar på händelser och transaktioner i realtid, utan att extrahera eller flytta några modeller eller data.
Tänk till exempel på en bank som utfärdar kreditkort och som behöver identifiera bedrägeririsker innan varje transaktion godkänns. Den kör en högpresterande kreditkortsapplikation i realtid som utvecklats med InterSystems IRIS och som lagrar alla demografiska och finansiella uppgifter om alla kunder och kreditkortstransaktioner. Denna applikation kan innehålla hundratals dataelement för varje kreditkortstransaktion - inklusive om varje transaktion var bedräglig eller giltig.
Med hjälp av IntegratedML kan de befintliga applikationsutvecklarna på banken automatiskt skapa en ML-modell för att identifiera högrisktransaktioner baserat på tidigare transaktioner, genom att helt enkelt välja det önskade fältet (t.ex. "is_fraudulent") och låta IntegratedML skapa den lämpligaste modellen och parametrarna.
Men till skillnad från traditionell AutoML kan den InterSystems IntegratedML-baserade modellen sömlöst införlivas i kreditkortsapplikationen, så att den kan utföras i realtid vid varje inkommande transaktion, och applikationen kan vidta lämpliga programåtgärder om modellen fastställer
att det finns en hög risk för bedrägeri, t.ex. förhindra transaktionen och ringa eller skicka ett sms till kortägaren.
IntegratedML gör det också lättare att hålla modellerna aktuella när applikationerna körs i produktion och nya data genereras. Angående kreditkortsbedrägerier, när programmet upptäckt och förhindrat en typ av bedrägeri, kommer säkert brottslingarna komma på och använda nya tekniker. Eftersom all data, inklusive den senaste informationen, lagras i dataplattformen behöver man inte skapa manuella utdrag och flytta data till olika miljöer. I stället kan banken kontinuerligt förfina modellerna med hjälp av de senaste uppgifterna för att upptäcka och förhindra nya attackmönster utan dröjsmål.
Med InterSystems IRIS och IntegratedML kan du utveckla applikationer som utför intelligenta normativa programåtgärder, som svar på händelser i realtid och få viktiga konkurrens- och affärsfördelar. Det kan hjälpa dig att vara först på marknaden med en ny produkt eller tjänst, först att agera på ett nytt initiativ och först att reagera på en förändring i kundernas beteende.
IntegratedML: Minska kostnaderna för talanger och förbättra produktiviteten
Med IntegratedML kan en utvecklare - med liten eller ingen kunskap om ML - använda SQL för att utveckla sofistikerade ML-modeller.
Detta betyder inte att du aldrig ska anställa dataingenjörer. Om din organisation är ett stort företag med ett team av dataingenjörer, kan IntegratedML spara mycket tid åt dina datatekniker och utvecklare. En undersökning från 2018 som utfördes av Kaggle ML and Data Science3 visade till exempel att dataingenjörer spenderar nästan 40 % av sin tid på att samla in och rensa data4 (se figur 1 nedan). Genom att använda IntegratedML för förberedelse och funktionsutveckling kan dina datavetare frigöra tid, för att fokusera på viktigare uppgifter med högre värde, t.ex. optimering av modeller.
För organisationer som precis har börjat med ML, kan InterSystems IntegratedML låta de programutvecklare och analytiker som bygger dina affärsapplikationer och som känner till datan utforska ML på egen hand. IntegratedML automatiserar det grundläggande arbetet, t.ex. att identifiera de lämpligaste modellerna, ställa in parametrar och bygga upp och träna modeller. Det snabbar också upp processen att integrera ML-modellerna i produktionsapplikationer. När dina utvecklare blir mer sofistikerade och börjar förstå processen och resultaten, kan de börja ändra valfria parametrar och själva ställa in värdena. Dataforskare kan också bli mer produktiva med IntegratedML, eftersom de kan lägga sin tid på själva modelloptimeringen i stället för att hantera data och välja och konstruera funktioner.
InterSystems Integrated ML: Hur det fungerar
Med IntegratedML kan träningsmodulen, inklusive identifiering av lämpliga inmatningsfunktioner från källdata, inställning av modellparametrar och exekvering, utföras med hjälp av en handfull SQL-kommandon.
CREATE MODEL WillSurvive PREDICTING (Survived) FROM Titanic
CREATE MODEL-kommandot ställer in metadata för modellen för maskininlärning. Utvecklarna anger modellens namn (WillSurvive), målfältet som ska förutsägas (Survived) och ett dataset som målfältet och alla modellens inmatningsfält ska hämtas från (Titanic). FROM-syntaxen är helt allmän och kan ange vilket "subquery"-uttryck som helst. De metadata som är kopplade till den här datamängden används också för att härleda datatyperna för mål- och inmatningsfälten, vilket ger en fullständig definition av det problem som modellen ska lösa.
TRAIN MODEL WillSurvive FROM Titanic
TRAIN MODEL-kommandot anger de data som ska användas för träning och kör AutoML-motorn, som tar emot en uppsättning tillförd relaterad data. Eftersom FROM-syntaxen är generell kan samma modell tränas flera gånger med olika uppsättningar data. Du kanske till exempel vill träna en modell för marknadsföringskampanjer för olika kundsegment eller träna om modellen regelbundet när ny träningsdata blir tillgängliga.
AutoML-motorn tar automatiskt hand om alla nödvändiga uppgifter för maskininlärning. Den identifierar relevanta kandidatfunktioner från den valda datan, överväger tillämpliga modelltyper utifrån uppgifterna och problemdefinitionen och justerar hyperparametrarna för att ge en eller flera körbara modeller.
Utvecklare kan välja mellan olika AutoML-motorer, inklusive InterSystems AutoML, H2O och DataRobot Enterprise AI Platform. Alla AutoML-motoralternativ är sömlöst integrerade i InterSystems IRIS och är transparenta för utvecklare.
SELECT PREDICT(WillSurvive) As Predicted FROM Titanic
SELECT PROBABILITY(WillSurvive FOR 1) FROM Titanic
När modellen har tränats ger den resultat via en av två skalära funktioner, PREDICT() och PROBABILITY(). PREDICT() returnerar det mest sannolika eller uppskattade värdet för den angivna kolumnen enligt den tränade modellen. För kategoriseringsproblem returnerar PROBABILITY() den tränade modellens beräknade sannolikhet för att modellens målfält kommer att vara lika med ett användardefinierat värde. Dessa enkla skalära funktioner kan användas var som helst i en fråga och i vilken kombination som helst med andra fält och funktioner. En av de viktigaste innovationerna som IntegratedML erbjuder, är att på ett transparent sätt ta hand om mappningen av de tillgängliga fälten i den givna frågekontexten, till de inmatningsfält som krävs för att köra modellen.
IntegratedML ger ytterligare flexibilitet för utvecklare, till exempel för att kartlägga andra datakällor än den tabell eller fråga som används för att skapa eller träna modellen, vilket illustreras av följande exempel:
SELECT Name, PREDICT(WillSurvive WITH Sex = Geschlecht, Age = DATEDIFF(year, NOW(), Geburtsdatum), Fare = TicketPreise, Cabin = Kabine) FROM Hindenburg
Medan de flesta AutoML-lösningar fungerar i en fristående miljö med en lös koppling med låg genomströmning till externa dataplattformar och tillämpningar, är IntegratedML annorlunda. Den fungerar sömlöst inom InterSystems IRIS dataplattform för att påskynda och förenkla träning och utförande av ML-modeller, och gör det möjligt att integrera ML-modellerna sömlöst i InterSystems IRIS-applikationer utan att flytta data eller modeller. Denna operationalisering av ML-modeller anses vara ett av de största hindren för en snabb användning av ML i affärsapplikationer.
InterSystems IRIS-dataplattform
InterSystems teknik driver 150 000 installationer världen över inom en rad olika branscher. InterSystems IRIS Data Platform är en komplett mjukvaruplattform för datahantering som är byggd för att påskynda och förenkla utvecklingen av datadrivna tillämpningar i realtid. InterSystems IRIS gör det möjligt för utvecklare att införliva sofistikerade analyser - inklusive affärsintelligens, AI, ML, behandling av naturligt språk och prediktiv analys - i verksamhetskritiska affärsprocesser i realtid. Den inbyggda högpresterande transaktions-analytiska databasmotorn stöder samtidigt både operativa och analytiska arbetsbelastningar i mycket stor skala.
Förutom de inbyggda funktionerna för ML-utveckling och driftstidsförmågan, möjliggör InterSystems IRIS också följande:
Dataintegration och programintegration - InterSystems IRIS tillhandahåller en komplett uppsättning integrations- och interoperabilitetsfunktioner för att rensa, omvandla och normalisera data och stödja sofistikerade integrationer. Den erbjuder omedelbar anslutning och datatransformationer för ett brett utbud av paketerade applikationer, databaser, industristandarder, protokoll och tekniker för att göra det enklare att integrera och analysera data och bygga prediktiva och normativa modeller.
Dessutom kan du bädda in analytisk bearbetning, t.ex. SQL-frågor, prediktiv analys, ML och Natural Language Processing (NLP), i sammansatta affärsprocesser som kopplar samman olika datakällor och applikationer. Dessa sammansatta processer kan effektivisera verksamheten, utlösa varningar och göra det utan att påverka applikationens prestanda.
Skalbarhet - InterSystems IRIS är vertikalt och horisontellt skalbar och mycket resurseffektiv, vilket gör den idealisk för applikationer som stöder mycket stora inmatningsvolymer, höga nivåer av analytisk arbetsbelastning, många samtidiga affärsprocesser och förmågan att bearbeta, lagra och analysera mycket stora datamängder på ett kostnadseffektivt sätt.
Rapportering och spårbarhet - All data (inklusive inkommande data, metadata och data som är kopplade till långvariga asynkrona transaktioner) lagras automatiskt i den inbyggda databasen och är tillgängliga för rapportering och analys i realtid. Visualisering och diagnostisering av integrationer och processer underlättas genom visuell spårning.
Grafisk utveckling - Grafiska verktyg med låg kod gör det möjligt för utvecklare att visuellt schematisera processer, omvandlingar, regler och arbetsflöden, så att de kan fokusera på de logiska interaktionerna mellan system i stället för att koda. De grafiska modellerna uppmuntrar till samarbete mellan affärsområden och IT, vilket gör det möjligt för din organisation att snabbare utveckla nya lösningar eller modifiera befintliga applikationer.
Implementering - InterSystems IRIS stöder ett brett utbud av implementeringsalternativ, inklusive alla större offentliga moln, privata moln, på plats och hybrida implementeringsalternativ.
Oavsett om du vill glädja dina kunder med personliga upplevelser i realtid, förbättra de kliniska resultaten för patienterna, förutse underhållsbehov i förväg eller upptäcka och förhindra bedrägerier i realtid kan InterSystems IRIS och IntegratedML hjälpa dig att uppnå dessa mål och mer därtill.
Slutsats
Maskininlärning är vägen framåt och alla organisationer som vill konkurrera måste börja använda den. Tyvärr är det ont om dataingenjörer och deras löner skjuter i höjden, vilket gör det svårt för stora organisationer att utöka sitt ML-avtryck och för små organisationer att komma igång med ML. Även om innovationer som AutoML är till hjälp är AutoML ensam inte tillräckligt.
InterSystems IntegratedML erbjuder sofistikerade AutoML-funktioner, exponerade genom ett intuitivt SQL-gränssnitt och helt integrerade i en omfattande dataplattform. IntegratedML gör det enkelt att använda ML-modeller i realtid i verksamhetskritiska tillämpningar, utan att behöva flytta data eller modeller och utan att det krävs en stab av dataingenjörer. Tillsammans gör InterSystems IRIS och IntegratedML det möjligt för dig att skapa en positiv förbättringscykel, genom att kontinuerligt förfina ML-modellerna utan dröjsmål med hjälp av den senaste produktionsdatan.
Om du har ett team av dataingenjörer kommer IntegratedML att förbättra teamets produktivitet.
Om du precis har börjat din AI-resa kan IntegratedML hjälpa dig att komma igång med ML utan att behöva anlita dyra ML-experter.
I båda fallen kan IntegratedML hjälpa dig:
- Snabbare och enklare skapande av ML-modeller
- Utför intelligenta programåtgärder i realtid
- Effektivisera processer för att förbättra kundupplevelsen, den operativa effektiviteten och produktiviteten
- Förbättra prognosprecisionen, påskynda bättre affärsresultat och överlista dina konkurrenter
- Utveckla smartare appar snabbare och enklare med färre resurser
- Vinn kriget om AI-talangerna
1 - Forrester Opportunity Snapshot. (2019) Datainsikter är nyckeln till differentierad kundupplevelse: En enhetlig plattform för dataanalys möjliggör snabb och kontextuellt relevant CX
2-
https://www.bls.gov/ooh/computer-and-information-technology/computer-and-information-research-scientists.htm
3 -
https://www.kaggle.com/headsortails/what-we-do-in-the-kernels-a-kaggle-survey-story
4 -
https://businessoverbroadway.com/2019/02/19/how-do-data-professionals-spend-their-time-ondata-science-projects/