機械学習を簡単に
簡単に開発でき、簡単に導入できる機械学習ソリューションで、人工知能の人材戦争に勝つ
Forrester Research社によると、「98%の企業が、収集したデータから洞察を得ることに課題を感じており、その主な原因は社内の専門知識の不足である」と言っています。1現在、お客様の組織はこれらの洞察がなくても競争力を維持できているかもしれませんが、デジタルトランスフォーメーションに向けた変化のペースは、すぐにお客様のビジネスに影響を与えるかもしれません。
それゆえ、あらゆる組織が、データを利用し、人工知能(AI)や機械学習(ML)を取り入れて、ビジネスを改善することに注力しています。
例えば、MLと予測分析を利用して、消費者の行動や好みをより深く理解することで、新規購入者を特定してターゲットにしたり、セールを行う最適な時期を特定したりすることができます。 医療機関であれば、コード化された診断だけでなく、患者の入院、転院、退院のデータを分析し、再入院率を下げることができます。 簡単に言えば、MLは時間とリソースを節約し、予測を改善し、より良い意思決定とより良い結果の実現を可能にします。
素晴らしいことですが、欠点もあります。MLモデルの開発は難しく、希少で高価な専門知識が必要です。
幸いなことに、業界の専門家はAutoMLやIntegratedML®などの新しいツールを開発することで、MLをより使いやすくするために努力しています。
IntegratedML技術概要
この技術概要を読めば、以下のことがわかります。
- ビジネスを成功させるためにMLが重要な理由
- 人材不足により、企業がMLを活用することが難しくなっている理由
- AutoMLとは何か、どのようにしてAI人材戦争に勝つことができるのか
- InterSystems IntegratedML®とは何か、そしてどのように設計されているのか
- 既存のソフトウェア開発者がMLモデルやML対応アプリケーションを開発できるようになる
- トレーニングを受けたデータサイエンティストの生産性を向上させる
- オペレーションと分析のプロセスを合理化し、顧客体験、業務効率、生産性を向上させる
- 予測精度の向上、より良いビジネス成果の創出、そして競合他社との差別化を可能にする
この技術概要は、MLチームの生産性を向上させたい方や、MLの専門家を雇わずにMLを始めたい方など、事業部の役員、マネージャー、IT専門家に適した内容となっています
機械学習:その価値
AIの応用として、MLは経験と推論からデータを学習する機械を訓練します。 特にプログラムされていなくても、継続的に成果を向上させることができます。
MLは、広範囲のデータを分析し、膨大な数の分析および運用要件を満たすために使用されるモデルを作成することができます。 オフラインでは、MLモデルは、ビジネスユーザーが顧客の行動を理解するのに役立ち、プロセスの効率化の問題を解決するなど、いくつかの応用例があります。 オンラインやビジネスの流れの中でMLを導入すれば、目に見える形で成果を上げることができます。例えば、お客様が商品を見ているときに好みの商品やサービスをお勧めしたり、サプライヤーが納品できないリスクが高い場合に販売前にプロアクティブに警告したり、取引を承認する前に不正な取引であるかどうかを判断したりすることができます。 営業、研究開発、法務、人事、カスタマーサポート、製品開発、さらには財務など、組織のあらゆる部分の部門業務がMLの恩恵を受けることができます。
Amazon AlexaやAppleのSiriのような仮想パーソナルアシスタント、スパムフィルターやマルウェア探知機、Facebookの新しい友達や新しいグループを提案する方法、オンラインカスタマーサポートを提供するチャットボット、自分で運転するスマートカーなど、あなたの日常生活の中ですでにMLを体験しています。
機械学習:課題
機械学習には多くのメリットがありますが、なぜ多くの企業が利用しないのかという疑問があります。 主要な理由の1つ:MLは高いレベルの専門家の獲得が難しいということです。
MLは、理論、技術、手法、ツールを理解している専門家が必要です。その理由の一つは、MLは使いこなすのが難しく、高度な専門知識が必要だからです。 今日では、このような専門家は数少なく、需要も高くなっています。 米国労働統計局の最新データによると、米国のデータサイエンティストの総数は3万2,000人を下回っています。2AIスペシャリストやデータサイエンティストの不足に加えて、その人材の多くは、アマゾン、フェイスブック、グーグル、マイクロソフトなどのデジタルジャイアントのように、目がくらむような高額な給与を支払っている企業に採用されています。 これでは、ただでさえ少ないリソースを獲得するために組織が競争するのは困難です。
AutoML:AI人材戦争に勝つために
自動機械学習(AutoML)は、現在のML人材の活躍の場を広げたいと考えている企業や、MLの旅を始めたばかりの企業にとって、急成長している新技術です。
AutoMLはデータサイエンスの比較的新しいアプローチで、MLモデルの作成を自動化し、簡素化します。 特徴量エンジニアリングを行い、生データをMLモデルに適した形式に変換するプロセスを自動化します。 モデルの選択、トレーニング、結果の分析を自動化し、様々なMLアルゴリズムを様々なパラメータでテストし、与えられた問題に対して最も正確なモデルを作成します。 データサイエンティストのチームがある組織では、MLモデルの構築に使用される手動および試行錯誤のプロセスの多くを自動化し、データサイエンティストの生産性を大幅に向上させ、時間と労力を節約することができます。
まだMLの専門家がスタッフにいない場合、特徴量エンジニアリングを実行し、モデルを作成してトレーニングすることは困難です。 しかし、AutoMLを使えば、データサイエンティストがいなくても有用なMLモデルを作成することができます。 その代わりに、簡単なユースケースとAutoMLから始めて、同時に開発者がより多くの分析とML開発プロセスを引き受けるようにトレーニングすることができます。
しかし、現在の多くのAutoMLツールは制限されています。 これらの製品は、MLモデルを作成することはできますが、そのモデルをリアルタイムのビジネスプロセスの中で実行する機能は提供していません。 これが InterSystems IntegratedMLの重要な違いの一つです。
InterSystems IntegratedML:AutoMLをさらに進化させる
InterSystems IntegratedMLは、完全なデータ管理ソフトウェア環境であるInterSystems IRIS®データプラットフォームの組み込み機能です。 IntegratedMLは、従来のAutoMLの機能やメリットをすべて備えています。 InterSystems IRISに組み込まれているため、モデルやデータを抽出したり移動したりすることなく、リアルタイムのイベントやトランザクションに応じてこれらのモデルを動的に実行する高度なアプリケーションを開発し、展開することができます。
例えば、クレジットカードを発行する銀行が、各トランザクションを承認する前に詐欺リスクを特定する必要があるとします。 これは、InterSystems IRISで開発されたリアルタイムで高性能なクレジットカード・アプリケーションを実行するもので、すべての顧客の個人属性データと財務データ、およびクレジットカード・トランザクションのすべてを保存します。 このアプリケーションには、各クレジットカード取引に関する何百ものデータ要素が含まれており、各取引が不正なものか有効なものかも含まれています。
IntegratedMLを使用して銀行の既存のアプリケーション開発者は、MLモデルを自動的に作成し、必要なフィールド(例 “is_fraudulent”)をチェックし、IntegratedMLに最適なモデルとパラメータを選択させることで、高リスクのトランザクションを特定するころができます。
しかし、従来のAutoMLとは異なり、InterSystems IntegratedMLベースのモデルは、クレジットカード・アプリケーションにシームレスに組み込むことができ、入力された各トランザクションでリアルタイムに実行されます。また、アプリケーションは、モデルが
、不正のリスクが高いと判断した場合、トランザクションを防止したり、カード所有者に電話やメールをするなど、適切なプログラム上のアクションを取ることができます。
IntegratedMLは、アプリケーションが本番で実行され、新しいデータが生成されても、モデルを簡単に最新の状態に保つこともできます。 クレジットカード詐欺の場合、アプリケーションによって一つの不正行為が検知され、防止されると、犯罪者たちは必ず新しい手法を開始します。 最新のデータを含むすべてのデータがデータプラットフォーム内に保存されているため、手動で抽出データを作成したり、異なる環境にデータを移動する必要がありません。 代わりに、銀行は最新のデータを使用してモデルを継続的に改良し、新しい攻撃パターンを遅滞なく検出して防止することができます。
InterSystems IRISとIntegratedMLを使用することで、リアルタイムのイベントに対応してインテリジェントな規定のプログラム・アクションを実行するアプリケーションを開発し、重要な競争上の優位性とビジネス上の利益を得ることができます。 新製品や新サービスをいち早く市場に投入したり、新しい取り組みをいち早く実行したり、お客様の行動の変化にいち早く対応したりするのに役立ちます。
IntegratedML:人材コストの削減と生産性の向上
IntegratedMLを使えば、MLの知識がほとんどない開発者でも、SQLを使って洗練されたMLモデルを開発することができます。
これは、データサイエンティストを絶対に雇ってはいけないということではありません。 データサイエンティストのチームを持つ大企業であれば、IntegratedMLはデータエンジニアやデータサイエンティストの時間を大幅に短縮することができます。 例えば、Kaggle ML and Data Science3が実施した2018年の調査によると、データサイエンティストはデータの収集とクリーニングに約40%の時間を費やしていることがわかりました4(以下の図1参照)。
InterSystems IntegratedMLは、MLに取り組み始めたばかりの企業にとって、ビジネスアプリケーションを構築し、データを熟知しているソフトウェア開発者やアナリストが、自らMLを探求することを可能にします。 IntegratedMLは、最適なモデルの特定、パラメータの設定、モデルの構築・学習などの基本的な作業を自動化します。 また、MLモデルを本番アプリケーションに統合するプロセスも早くなります。 開発者がより洗練され、プロセスや結果を理解し始めると、オプションのパラメータを変更したり、自分で値を設定することができるようになります。 データサイエンティストもIntegratedMLを使うことで、データの整理や機能のエンジニアリングや選択ではなく、実際のモデルの最適化に時間を割くことができ、生産性が向上します。
InterSystems IntegratedML:その仕組み
IntegratedMLでは、ソースデータからの適切な入力特徴の特定、モデルパラメータのチューニング、実行など、モデルのトレーニングをわずかなSQLコマンドで行うことができます。
CREATE MODEL WillSurvive PREDICTING (Survived) FROM TitanicCREATE
MODELコマンドは、機械学習モデルのメタデータを設定します。 開発者は、モデルの名前(WillSurvive)、予測されるターゲットフィールド(Survived)、ターゲットフィールドとすべてのモデル入力フィールドのソースとなるデータセット(Titanic)を指定します。 FROM構文は完全に汎用的で、任意のサブクエリ式を指定できます。 また、このデータセットに関連するメタデータは、ターゲットフィールドと入力フィールドのデータタイプを推測するために使用され、モデルが解決すべき問題を完全に定義します。
TRAIN MODEL WillSurvive FROM Titanic
TRAIN MODEL コマンドは、学習に使用するデータを指定し、リレーショナルデータのセットを入力として、AutoMLエンジンを実行します。 FROMの構文は一般的なので、同じモデルを異なるデータセットで複数回学習することができます。 例えば、マーケティングキャンペーンモデルを異なる顧客セグメントで学習させたり、新しい学習データが利用可能になったときにモデルを定期的に再学習させたりすることができます。
AutoMLエンジンは、必要な機械学習タスクをすべて自動的に処理します。
開発者は、InterSystems AutoML、H2O、DataRobot Enterprise AI Platformなど、さまざまなAutoMLエンジンから選択することができます。 すべてのAutoMLエンジンのオプションは、InterSystems IRISにシームレスに統合されており、開発者にとっては透過的です。
SELECT PREDICT(WillSurvive) As Predicted FROM Titanic
SELECT PROBABILITY(WillSurvive FOR 1) FROM Titanic
学習されたモデルは、PREDICT()とPROBABILITY()という2つのスカラ関数のうちの1つを介して結果を提供します。 PREDICT()は、学習されたモデルによって決定された、指定された列の最も可能性の高い値または推定値を返します。 カテゴリー分けの問題では、PROBABILITY()は、モデルのターゲットフィールドがユーザー定義の値と等しくなる確率を学習済みモデルで計算して返します。 これらのシンプルなスカラー関数は、クエリの任意の場所で、他のフィールドや関数と自由に組み合わせて使用することができます。
IntegratedMLは、開発者にさらなる柔軟性を提供します。例えば、以下の例で示されるように、モデルの作成やトレーニングに使用された特定のテーブルやクエリ以外のデータソースにマッピングすることができます。
SELECT Name, PREDICT(WillSurvive WITH Sex = Geschlecht, Age = DATEDIFF(year, NOW(), Geburtsdatum) FROM Hindenburg
多くのAutoMLソリューションは、外部のデータプラットフォームやアプリケーションとの緩やかで低スループットの結合を持つスタンドアロン環境で動作しますが、IntegratedMLは異なります。 InterSystems IRISのデータプラットフォーム内でシームレスに動作し、MLモデルのトレーニングと実行を高速化・簡素化し、データやモデルを移動することなく、InterSystems IRISのアプリケーション内にMLモデルをシームレスに統合することができます。 このようなMLモデルの運用化は、ビジネスアプリケーションへのMLの迅速な導入を妨げる最大の要因の一つと考えられます。
InterSystems IRIS Data Platform
インターシステムズのテクノロジーは、さまざまな業界において、世界中で150,000の導入実績があります。 InterSystems IRIS Data Platformは、リアルタイムのデータ駆動型アプリケーションの開発を迅速かつ容易にするために構築された、完全なデータ管理ソフトウェア・プラットフォームです。 InterSystems IRISは、開発者が、ビジネスインテリジェンス、AI、ML、自然言語処理、予測分析などの高度な分析を、リアルタイムでミッションクリティカルなビジネスプロセスに組み込むことを可能にします。 組み込み型の高性能トランザクション分析データベース・エンジンは、非常に大規模な運用ワークロードと分析ワークロードの両方を同時にサポートしています。
組み込み型のML開発およびランタイム機能に加えて、InterSystems IRISは以下のことも可能にします。
データおよびアプリケーションの統合 - InterSystems IRISは、データのクリーンアップ、変換、正規化、および高度な統合をサポートする統合および相互運用性の完全なセットを提供しています。 パッケージ化されたさまざまなアプリケーション、データベース、業界標準、プロトコル、テクノロジーに対して、すぐに使える接続性とデータ変換機能を提供し、データの統合・分析や予測・判断モデルの構築を容易にします。
また、異種のデータソースやアプリケーションをつなぐ複合ビジネスプロセスに、SQLクエリ、予測分析、ML、自然言語処理(NLP)などの分析処理を組み込むことができます。 これらの複合プロセスは、アプリケーションのパフォーマンスに影響を与えることなく、オペレーションを合理化し、アラートをトリガーすることができます。
拡張性- InterSystems IRISは、垂直および水平方向の拡張性をもち、リソース効率が非常に高いため、非常に大量の取り込み率、高レベルの分析ワークロード、多数のコンカレントなビジネス・プロセスをサポートするアプリケーションに最適です。
レポーティングとトレーサビリティ- すべてのデータ(使用中のデータ、メタデータ、長時間実行された非同期トランザクションに関連するデータを含む)は、自動的に組み込みデータベースに保存され、リアルタイムのレポーティングと分析に利用できます。 ビジュアルトレース機能により、統合やプロセスの動作の可視化と診断が容易になります。
グラフィカルな開発- グラフィカルなローコードツールにより、開発者はプロセス、変換、ルール、ワークフローを視覚的に図示することができるため、コーディングではなくシステム間の論理的な相互作用に集中することができます。 グラフィカルなモデルは、ビジネスラインとITのコラボレーションを促進し、組織が新しいソリューションを開発したり、既存のアプリケーションを迅速に変更したりすることを可能にします。
配備- InterSystems IRISは、すべての主要なパブリック・クラウド、プライベート・クラウド、オンプレミス、ハイブリッド配備オプションを含む、幅広い展開オプションをサポートしています。
リアルタイムにパーソナライズされた体験で顧客を喜ばせたい、患者の臨床結果を改善したい、故障に先立ってメンテナンスの必要性をプロアクティブに予測したい、またはリアルタイムに不正を検出して防止したいなど、
InterSystems IRIS とIntegratedMLは、これらの目標を達成するために役立ちます。
結論
機械学習は未来の波であり、競争に打ち勝つためには、どの組織も機械学習を使い始める必要があります。 残念ながら、データサイエンティストは不足しており、その給与も高騰しているため、大企業がMLの導入範囲を拡大することや、小規模な組織がMLを始めることは困難です。
InterSystems IntegratedML は、洗練された AutoML 機能を直感的な SQL インターフェイスで提供し、包括的なデータプラットフォームに完全に統合されています。 IntegratedMLは、データやモデルを移動させることなく、またデータサイエンティストのスタッフを必要とすることなく、リアルタイムでミッションクリティカルなアプリケーションにMLモデルを簡単に導入することができます。 InterSystems IRISと IntegratedMLを使用することで、好循環な改善が可能で、最も新しいプロだ九品データへの応答に遅延することなく、MLモデルを継続的に改善することができます。
データサイエンティストのチームがある場合、IntegratedMLはチームの生産性を向上させます。
AIの旅を始めたばかりの場合、IntegratedMLは、高価なML専門家を雇うことなく、今すぐMLを始めることができます。
いずれの場合も、IntegratedMLがお役に立ちます。
- MLモデル作成のスピードアップと簡素化
- インテリジェントなプログラマティック・アクションをリアルタイムで実行
- プロセスを合理化し、顧客体験、業務効率、生産性を向上させる
- 予測精度を向上させ、より良いビジネス成果を加速させ、競合他社を凌駕する
- よりスマートなアプリケーションを、より少ないリソースで、より速く、より簡単に開発することができる
- AI人材戦争に勝つために
1 - Forrester Opportunity Snapshot(フォレスター・オポチュニティ・スナップショット) (2019) 差別化された顧客体験の鍵となるデータインサイト:統一されたデータアナリティクスプラットフォームがタイムリーで文脈に沿ったCX
2を可能にする
- https://www.bls.gov/ooh/computer-and-informatio
n-technology/computer-and-information-research-scientists.htm3
- https://www.kaggle.com/headsor
tails/what-we-do-in-the-kernels-a-kaggle-survey-story4
- https://businessoverbroadway.com/2019/02/19/how-do-data-professionals-spend-their-time-ondata-science-projects/