Snadné strojové učení
Vyhrajte válku s talenty v oblasti umělé inteligence pomocí řešení strojového učení, které se snadno vyvíjí a nasazuje
Podle společnosti Forrester Research "98 % společností má problémy se získáváním poznatků ze shromážděných dat; je to způsobeno především nedostatkem interních odborných znalostí".1 Zatímco dnes si vaše organizace může udržet konkurenční výhodu i bez těchto poznatků, tempo změn směrem k digitální transformaci může brzy ovlivnit vaše podnikání.
Proto se organizace všude zaměřují na využívání dat - a zapojení umělé inteligence (AI) a strojového učení (ML) - ke zlepšení svého podnikání. Pomocí ML můžete zlepšit a automatizovat obchodní operace, předvídat události a chování a na základě těchto předpovědí proaktivně provádět preskriptivní programové akce.
Pomocí ML a prediktivní analýzy může vaše organizace například identifikovat a zacílit nové kupující nebo určit nejlepší časy pro spuštění prodeje díky lepšímu pochopení chování a preferencí spotřebitelů. Jste-li poskytovatelem zdravotní péče, může vaše organizace analyzovat kódované diagnózy a údaje o přijetí, převozu a propuštění pacienta, aby snížila míru opakovaných přijetí. Jednoduše řečeno, ML může ušetřit čas a zdroje, zlepšit prognózování a umožnit vám činit lepší rozhodnutí a dosahovat lepších výsledků.Zní to skvěle, ale je tu jedna nevýhoda: Vývoj ML modelů je obtížný a vyžaduje vzácné - a drahé - odborné znalosti.Naštěstí se odborníci z oboru snaží usnadnit používání ML vývojem nových nástrojů, včetně AutoML a IntegratedML®
.
Stručný přehled technologie IntegratedML
Při čtení tohoto technologického přehledu zjistíte:
- Proč je ML klíčový pro úspěch vašeho podnikání
- Jak nedostatek talentů ztěžuje organizacím využití ML
- Co je AutoML a jak vám pomůže vyhrát válku o talenty v oblasti umělé inteligence
- Co je InterSystems IntegratedML® a jak je navržen pro:
- Umožnění vaším stávajícím vývojářům softwaru vyvíjet modely ML a aplikace s podporou ML.
- Zvýšení produktivity vyškolených datových vědců.
- Zefektivnění provozních a analytických procesů s cílem zlepšit zákaznickou zkušenost, provozní efektivitu a produktivitu.
- Zlepšení přesnosti předpovědí, dosažení lepších obchodních výsledků a odlišení se od konkurence.
Tento technologický souhrn je vhodným čtením pro vedoucí pracovníky, manažery a IT profesionály, ať už chcete rozšířit produktivitu svého týmu ML, nebo s ML teprve začínáte, aniž byste museli najímat odborníky na ML.
Strojové učení: hodnota
ML jako aplikace umělé inteligence trénuje stroj, aby se učil o datech na základě zkušeností a odvozování. Průběžně zlepšuje výsledky, aniž by k tomu byl speciálně naprogramován.
ML dokáže analyzovat širokou škálu dat a vytvářet modely, které slouží k uspokojení široké škály analytických a provozních požadavků. Offline, ML modely mohou pomoci obchodním uživatelům pochopit chování zákazníků nebo problémy s efektivitou procesů, abychom jmenovali jen několik aplikací. Při nasazení online nebo v běžném provozu podniku může ML velmi viditelně přinést lepší výsledky - ať už jde o doporučení preferovaného produktu nebo služby zákazníkovi během prohlížení webu, proaktivní upozornění před uskutečněním prodeje, pokud existuje vysoké riziko, že dodavatel nebude schopen dodat zboží, nebo určení, zda transakce může být podvodná, ještě před jejím schválením. Provozní oddělení v každé části vaší organizace mohou mít prospěch z ML, včetně prodeje a marketingu, výzkumu a vývoje, právního oddělení, lidských zdrojů, zákaznické podpory, vývoje produktů a dokonce i financí. Skutečnost je taková, že ML přináší užitek téměř v každém odvětví a slibuje, že se stane všudypřítomným, jak jej bude využívat stále více organizací.
S ML se již setkáváte ve svém každodenním životě: od virtuálních osobních asistentů, jako je Amazon Alexa a Apple Siri, přes filtry spamu a detektory malwaru, metodu Facebooku pro navrhování nových přátel a nových skupin, chatboty, kteří poskytují online zákaznickou podporu, až po chytrá auta, která se řídí sama.
Strojové učení: výzva
Strojové učení přináší mnoho výhod, ale nabízí se otázka: proč ho nepoužívá více společností? Jeden z klíčových důvodů: ML je obtížné používat a vyžaduje vysokou úroveň odborných znalostí.
ML vyžaduje odborníky, kteří rozumí teorii, technologii, metodám a nástrojům. Dnes je těchto odborníků málo a jsou velmi žádaní. Podle nejnovějších údajů amerického Úřadu pro statistiku práce je v USA celkem méně než 32 000 datových vědců.2 Nedostatek odborníků na umělou inteligenci a datových vědců ještě zhoršuje fakt, že většinu dostupných talentů najímají digitální giganti, jako jsou Amazon, Facebook, Google a Microsoft, kteří za ně platí závratně vysoké platy. Organizace tak mají ztíženou možnost soutěžit o tyto již tak omezené zdroje.
AutoML: Vítězství ve válce talentů v oblasti umělé inteligence
Automatizované strojové učení (AutoML) je nová, rychle se rozvíjející technologie pro organizace, které chtějí rozšířit záběr svých současných talentů v oblasti ML, a pro ty, které s ML teprve začínají.
AutoML je relativně nový přístup k datové vědě - automatizuje a zjednodušuje vytváření ML modelů. Provádí feature engineering, automatizuje proces transformace surových dat do formátů vhodných pro modely ML. Automatizuje výběr modelu, trénování a analýzu výsledků - a testuje různé algoritmy ML s různými parametry, aby vytvořil nejpřesnější model pro daný problém. Pro organizace s týmem datových vědců to automatizuje většinu manuálních procesů a procesů typu pokus-omyl, které se používají při vytváření modelů ML, a výrazně zvyšuje produktivitu vašich datových vědců, čímž šetří čas a úsilí.
Pokud nemáte k dispozici specialisty na ML, může být provádění feature engineeringu a vytváření a trénování modelů náročné. Díky AutoML však nyní vaše organizace nemusí nutně potřebovat datové vědce, aby vytvořila užitečné ML modely. Místo toho můžete začít s jednoduchými případy užití a AutoML a současně školit své vývojáře, aby se mohli věnovat větší části procesu analýzy a vývoje ML.
Mnoho dnešních nástrojů AutoML je však omezených. Dokážou sice vytvářet ML modely, ale neposkytují žádnou funkci pro spouštění modelů v rámci podnikových procesů v reálném čase. To je jeden z důležitých způsobů, kterým se InterSystems IntegratedML liší.
InterSystems IntegratedML: prostřednictvím AutoML k vyššímu výkonu
InterSystems IntegratedML je integrovanou funkcí datové platformy InterSystems IRIS®, kompletního softwarového prostředí pro správu dat. IntegratedML poskytuje všechny funkce a výhody tradičního jazyka AutoML. Protože je však integrován v systému InterSystems IRIS, můžete vyvíjet a nasazovat sofistikované aplikace, které tyto modely plynule dynamicky provádějí v reakci na události a transakce v reálném čase, aniž byste museli extrahovat nebo přesouvat jakékoli modely nebo data.
Vezměme si například banku, která vydává kreditní karty a která potřebuje identifikovat riziko podvodu před schválením každé transakce. Provozuje vysoce výkonnou aplikaci kreditních karet v reálném čase vyvinutou pomocí systému InterSystems IRIS, který uchovává veškeré demografické a finanční údaje o všech zákaznících a transakcích kreditními kartami. Tato aplikace může obsahovat stovky datových prvků pro každou transakci kreditní kartou - včetně toho, zda byla každá transakce podvodná nebo platná.
Pomocí IntegratedML mohou stávající vývojáři aplikací v bance automaticky vytvořit ML model pro identifikaci vysoce rizikových transakcí na základě minulých transakcí, a to tak, že jednoduše vyberou požadované pole (např. "is_fraudulent") a nechají IntegratedML vytvořit nejvhodnější model a parametry.
Na rozdíl od tradičního AutoML však může být model založený na InterSystems IntegratedML bez problémů začleněn do aplikace kreditních karet, aby se prováděl v reálném čase s každou příchozí transakcí, a aplikace může provést příslušné programové akce, pokud model určí
, že existuje vysoké riziko podvodu, například zabránit transakci a zavolat a poslat SMS majiteli karty.
IntegratedML také usnadňuje udržování modelů v aktuálním stavu, protože aplikace běží v produkci a generují se nová data. V případě podvodů s kreditními kartami, kdy aplikace odhalí jeden způsob podvodu a zabrání mu, budou zločinci jistě iniciovat nové techniky. Vzhledem k tomu, že všechna data, včetně těch nejnovějších, jsou uložena v datové platformě, není třeba vytvářet ruční výpisy a přesouvat data do různých prostředí. Místo toho může banka průběžně zpřesňovat modely na základě nejnovějších dat, aby bez prodlení odhalila nové vzory útoků a zabránila jim.
S InterSystems IRIS a IntegratedML můžete vyvíjet aplikace, které provádějí inteligentní preskriptivní programové akce v reakci na události v reálném čase, a získat tak kritické konkurenční výhody a obchodní výhody. Může vám pomoci být první na trhu s novým produktem nebo službou, první jednat v rámci nové iniciativy a první reagovat na změnu chování zákazníků.
IntegratedML: Snížení nákladů na talenty a zvýšení produktivity
S nástrojem IntegratedML může vývojář - s malými nebo žádnými znalostmi ML - používat SQL k vývoji sofistikovaných ML modelů.
Tím neříkáme, že byste nikdy neměli najímat datové vědce. Pokud je vaše organizace velkým podnikem s týmem datových vědců, IntegratedML může vašim datovým inženýrům a vědcům ušetřit značnou část času. Například průzkum provedený v roce 2018 společností Kaggle ML and Data Science3 zjistil, že datoví vědci stráví téměř 40 % svého času shromažďováním a čištěním dat4 (viz obrázek 1 níže). Použití jazyka IntegratedML pro přípravu dat a feature engineering může uvolnit vaše datové vědce, aby se mohli soustředit na důležitější úkoly s vyšší hodnotou, jako je optimalizace modelů.
Organizacím, které s ML teprve začínají, umožňuje InterSystems IntegratedML softwarovým vývojářům a analytikům, kteří vytvářejí vaše podnikové aplikace a znají data, zkoumat ML na vlastní pěst. IntegratedML automatizuje základní práce, jako je identifikace nejvhodnějších modelů, nastavení parametrů a sestavení a trénování modelů. Urychluje také proces integrace modelů ML do produkčních aplikací. Jakmile se vývojáři stanou sofistikovanějšími a začnou rozumět procesu a výsledkům, mohou začít upravovat volitelné parametry a sami nastavovat hodnoty. Datoví vědci mohou být s nástrojem IntegratedML také produktivnější, protože mohou svůj čas věnovat skutečné optimalizaci modelu namísto práce s daty a vytvářením a výběrem funkcí.
InterSystems Integrated ML: Jak to funguje
Pomocí nástroje IntegratedML se trénování modelu, včetně identifikace správných vstupních funkcí ze zdrojových dat, ladění parametrů modelu a jeho provádění, provádí pomocí pouhých několika příkazů SQL.
CREATE MODEL WillSurvive PREDICTING (Survived) FROM Titanic
Příkaz CREATE MODEL nastavuje metadata modelu strojového učení. Vývojáři zadají název modelu (WillSurvive), cílové pole, které má být předpovídáno (Survived), a datovou sadu, ze které se má cílové pole a všechna vstupní pole modelu získat (Titanic). Syntaxe FROM je zcela obecná a lze v ní zadat libovolný výraz poddotazu. Metadata spojená s touto sadou dat se rovněž používají k odvození datových typů cílových a vstupních polí, čímž se plně definuje problém, který má model řešit.
TRÉNOVACÍ MODEL WillSurvive FROM Titanic
Příkaz TRÉNOVACÍ MODEL určuje data, která se mají použít pro trénování, a spouští engine AutoML, který jako vstup přijímá sadu relačních dat. Protože syntaxe FROM je obecná, lze stejný model trénovat vícekrát s různými sadami dat. Můžete například chtít trénovat model marketingové kampaně na různých segmentech zákazníků nebo pravidelně přetrénovat model, jakmile budou k dispozici nová tréninková data.
Engine AutoML se automaticky postará o všechny potřebné úlohy strojového učení. Z vybraných dat identifikuje relevantní kandidátní funkce, na základě dat a definice problému zváží použitelné typy modelů a vyladí hyperparametry tak, aby vznikl jeden nebo více spustitelných modelů.
Vývojáři si mohou vybrat z různých strojů AutoML, včetně InterSystems AutoML, H2O a DataRobot Enterprise AI Platform. Všechny volby pohonu AutoML jsou bezproblémově integrovány do systému InterSystems IRIS a jsou pro vývojáře transparentní.
SELECT PREDICT(WillSurvive) As Predicted FROM Titanic
SELECT PROBABILITY(WillSurvive FOR 1) FROM TitanicPo
natrénování poskytuje model výsledky prostřednictvím jedné ze dvou skalárních funkcí, PREDICT() a PROBABILITY(). Funkce PREDICT() vrátí nejpravděpodobnější nebo odhadovanou hodnotu zadaného sloupce určenou natrénovaným modelem. Pro kategorizační úlohy vrací funkce PROBABILITY() vypočtenou pravděpodobnost, že cílové pole modelu se bude rovnat uživatelem definované hodnotě. Tyto jednoduché skalární funkce lze použít kdekoli v dotazu a v libovolné kombinaci s jinými poli a funkcemi. Jednou z klíčových inovací, které IntegratedML poskytuje, je transparentní péče o mapování dostupných polí v daném kontextu dotazu na vstupní pole potřebná k provedení modelu.
IntegratedML poskytuje vývojářům další flexibilitu, například pro mapování na jiné zdroje dat, než je konkrétní tabulka nebo dotaz použitý k vytvoření nebo trénování modelu, jak ilustruje následující příklad:
SELECT Name, PREDICT(WillSurvive WITH Sex = Geschlecht, Age = DATEDIFF(year, NOW(), Geburtsdatum), Fare = TicketPreise, Cabin = Kabine) FROM Hindenburg Zatímco
většina řešení AutoML pracuje v samostatném prostředí s volným, málo průchodným propojením s externími datovými platformami a aplikacemi, IntegratedML je jiný. Funguje bez problémů v rámci datové platformy InterSystems IRIS, což urychluje a zjednodušuje trénování a provádění modelů ML a umožňuje bezproblémovou integraci modelů ML do aplikací InterSystems IRIS bez nutnosti přesouvat data nebo modely. Snadné zprocesování modelů ML je považována za jednu z největších překážek rychlého přijetí ML v podnikových aplikacích.
Datová platforma InterSystems IRIS
Technologie InterSystems zajišťuje 150 000 nasazení po celém světě v různých odvětvích. Datová platforma InterSystems IRIS je kompletní softwarová platforma pro správu dat, která byla vytvořena s cílem urychlit a zjednodušit vývoj aplikací založených na datech v reálném čase. InterSystems IRIS umožňuje vývojářům začlenit sofistikovanou analytiku - včetně business intelligence, AI, ML, zpracování přirozeného jazyka a prediktivní analýzy - do kritických podnikových procesů v reálném čase. Vestavěný vysoce výkonný transakčně-analytický databázový stroj současně podporuje provozní i analytické úlohy ve velmi vysokém rozsahu.
Kromě vestavěných možností vývoje a vykonávání ML umožňuje InterSystems IRIS také:
Integraci dat a aplikací - InterSystems IRIS poskytuje kompletní sadu integračních a interoperabilních funkcí pro čištění, transformaci a normalizaci dat a podporu sofistikovaných integrací. Poskytuje hotovou konektivitu a transformace dat pro širokou škálu balíčkových aplikací, databází, průmyslových standardů, protokolů a technologií, které usnadňují integraci a analýzu dat a vytváření prediktivních a preskriptivních modelů.
Kromě toho můžete do složených podnikových procesů, které propojují různorodé zdroje dat a aplikace, začlenit analytické zpracování, například dotazy SQL, prediktivní analýzu, ML a zpracování přirozeného jazyka (NLP). Tyto složené procesy mohou zefektivnit operace, spouštět výstrahy, a to bez dopadu na výkon aplikace.
Škálovatelnost - InterSystems IRIS je vertikálně i horizontálně škálovatelný a vysoce efektivní z hlediska zdrojů, takže je ideální pro aplikace, které podporují velmi vysoké objemy příjmu dat, vysokou úroveň analytické zátěže, mnoho souběžných obchodních procesů a schopnost zpracovávat, ukládat a analyzovat velmi rozsáhlé datové sady nákladově efektivním způsobem.
Reportování a sledovatelnost - Všechna data (včetně dat za běhu, metadat a dat spojených s dlouhodobými asynchronními transakcemi) jsou automaticky ukládána do vestavěné databáze a jsou k dispozici pro reportování a analýzu v reálném čase. Vizualizaci a diagnostiku chování integrací a procesů usnadňují možnosti vizuálního sledování.
Grafický vývoj - Grafické nástroje s nízkým kódem umožňují vývojářům vizuálně diagramovat procesy, transformace, pravidla a pracovní postupy, takže se mohou soustředit na logické interakce mezi systémy, nikoli na kódování. Grafické modely podporují spolupráci mezi obchodním zaměřením a IT, což vaší organizaci umožňuje rychleji vyvíjet nová řešení nebo upravovat stávající aplikace.
Nasazení - InterSystems IRIS podporuje širokou škálu možností nasazení, včetně všech hlavních veřejných cloudů, privátních cloudů, on premises a hybridních možností nasazení.
Ať už chcete potěšit své zákazníky personalizovanými zkušenostmi v reálném čase, zlepšit klinické výsledky pacientů, proaktivně předvídat potřeby údržby v předstihu před poruchami nebo odhalovat a předcházet podvodům v reálném čase, InterSystems IRIS a IntegratedML vám mohou pomoci dosáhnout těchto a dalších cílů.
Více informací o InterSystems IRIS
Závěr
Strojové učení je vlnou budoucnosti a každá organizace, která chce konkurovat, jej musí začít používat. Datových vědců je bohužel málo a jejich platy prudce rostou, což velkým organizacím ztěžuje rozšiřování jejich působnosti v oblasti ML a malým organizacím začít s ML. Přestože inovace, jako je AutoML, pomáhají, samotný AutoML nestačí.
InterSystems IntegratedML poskytuje sofistikované funkce AutoML, které jsou vystaveny prostřednictvím intuitivního rozhraní SQL a plně integrovány do komplexní datové platformy. IntegratedML usnadňuje nasazení ML modelů v kritických aplikacích v reálném čase, aniž by bylo nutné přesouvat data nebo modely a aniž by bylo nutné zaměstnávat datové vědce. Společně vám InterSystems IRIS a IntegratedML umožní vytvořit cyklus zdokonalování, který neustále vylepšuje ML modely bez prodlení v reakci na nejnovější produkční data.
Pokud máte tým datových vědců, IntegratedML zvýší produktivitu vašeho týmu.
Pokud s umělou inteligencí teprve začínáte, IntegratedML vám pomůže začít s ML hned, bez nutnosti najímat drahé ML experty.
V obou případech vám IntegratedML pomůže:
- Zrychlit a zjednodušit tvorbu modelů ML
- Provádět inteligentní programové akce v reálném čase
- Zefektivnit procesy pro zlepšení zákaznických zkušeností, provozní efektivity a produktivity
- Zlepšit přesnost předpovědí, urychlit dosažení lepších obchodních výsledků a předběhnutí konkurenci
- Vyvinout chytřejší aplikace rychleji a snadněji s menším počtem zdrojů
- Vyhrát válku o talenty v oblasti umělé inteligence
Další informace o systému InterSystems IRIS
1 - Forrester Opportunity Snapshot. (2019) Data Insights Are Key to Differentiated Customer Experience: A Unified Data Analytics Platform Enables Timely and Contextually Relevant C
X2 -
https://www.bls.gov/ooh/computer-and-information-technology/computer-and-information-research-scientists.htm3 -
https://www.kaggle.com/headsortails/what-we-do-in-the-kernels-a-kaggle-survey-story4 -
https://businessoverbroadway.com/2019/02/19/how-do-data-professionals-spend-their-time-ondata-science-projects/