機械学習(ML)と人工知能(AI)は、成功している組織の中核機能になりつつあり、こうしたアプリケーションの構築あるいは破壊をする上で、データがますます重要な役割を果たすようになっています。
効果的で正確な AI と ML に必要な燃料は、健全で正規化された包括的なデータです。今日の競争の激しいビジネス環境では、企業はアナリティクスから貴重な洞察を得て、収益に影響を与える重要なビジネス上の意思決定をより良く伝えることができます。これらの意思決定を健全なデータに基づいて行うかどうかが、成功か失敗かの分かれ目になることがよくあります。
貧弱なデータや不健康なデータは、米国に 年間3兆ドル以上のコストをかけていると推定されています。十分なデータへのアクセスがないデータサイエンスチームは、成功する ML アーキテクチャやモデルを構築するために必要なリソースが不足しており、システムに欠陥がある可能性があり、また望ましくない結果につながる可能性があります。
健全なデータの基盤:組織
健全なデータとは、重複するレコード、欠落した情報、書式エラー、不正確な情報、不一致用語などがない状態のことです。組織で生成され、利用できるようになるデータの量は指数関数的に増加しているため、大量のデータを組織的に収集することは大きな課題となります。この氾濫するデータのペースを維持し、適切に収集できないと、多くの場合、洞察を得られなかったり欠陥のあるアウトプットにつながります。
健全なデータを最適化しようとする組織は、ビジネスの目的を超えて考え、どのようなデータをどこからどのように収集し、どのようにしてクリーン化するか、そしてその使用方法をどのようにビジネスの目標に結びつけるかを特定し、統合的なアプローチを取らなければなりません。
健全なデータの利点
健全なデータは、ビジネスのあらゆる領域をよりよく洞察するための道を導く。しかし、最も最先端のモデルでも、不健康なデータの小さな部分が大幅に結果をゆがめることができます。健全なデータは、以下を提供することで組織全体の有効性を高める能力を持ちます。
- 信頼できるデータ:組織はデータがクリーンであることを信頼して、機会が失われたり、脅威を逃す前に、迅速かつ正確なビジネス上の意思決定を行うことができるようにしなければなりません。
- リアルタイムの意思決定とアクション:健全なデータを活用することで、組織はデータを即座に活用して意思決定の指針としたり、競争力を維持。
- より良いAI:健全なデータを使用することで、データサイエンティストは、データの雑多な処理や整理をするのではなく、ビジネスを向上させる分析の実施に集中することができます。
組織がAIやMLをより効率的に活用し、ビジネス成果を向上させ、業務効率を向上させたい場合、健全なデータへのアクセスが必要となります。すべては健全でクリーンなデータから始まり、そこからビジネス価値の機会は無限に広がります。
スコット・ナウ(Scott Gnau)
2019年、データプラットフォーム担当副社長としてインターシステムズに入社し。InterSystems IRIS® Data Platform製品ファミリーの開発、管理、販売を統括している。
データ管理の分野で20年以上の経験を持ち、エンタープライズレベルの組織のテクノロジーとデータ・アーキテクチャのイニシアチブをリードしてきた。インターシステムズ入社以前は、HortonWorks社で最高技術責任者を務めていた。それ以前は、Teradata社で20年間を務め、Teradata Labs社の社長を務めるなど、上級職に就いていました。
ドレクセル大学にて電気工学の学士号を取得。