※本ポストは2023年6月8日に米国で公開された“This New Data Glossary Will Demystify Data for You and Your Teams”の翻訳版です。本ポストの正式言語は英語であり、その内容および解釈については英語が優先されます。
2025年までに、世界で生成されるデータ量は12時間毎に2倍になるといわれています。大量のデータが組織の中を移動するこうした状況では、データの専門家のみならず、誰もがデータを活用できることが理想的です。人工知能(AI)によって、私たちは情報の海からビジネスに必要なインサイトを汲み取れるようになりましたが、AIが行う意思決定について学び、改善していくにはデータが必要不可欠です。
そんなときはぜひ本用語集をご活用いただき、経営陣からチームのメンバーに至るまで、組織の全員でデータリテラシーを身につけいきましょう。
これらの重要な用語に精通すれば、技術的な能力に関わらず、あなたもそしてチームメンバーの皆さんもデータについて自信を持って話せるようになるだけではなく、ビジネスでの価値創出にデータを活用する方法を理解することができます。
一括処理とは、コンピューターが大量のデータに関する反復作業やまとまったタスクを自動的に実行するときに、一連の異なる作業としてではなく、単一の作業として処理することを指します。特定のプロセッサ集中型タスクは、個別に実行すると非効率的な場合がありますが、一括処理ではデータジョブをまとめて、コンピューターの計算リソースを節約するためにオフピーク時間に実行されることが多いです。
ビジネス分析とは、データを使用して仮説を検証し、多くの場合、将来のパフォーマンスに関する予測や、より多くの情報に基づいた意思決定を行う実践のことを指します。ビジネス分析は予測的なものです。つまり、データをモデル化し、それらを分析して、新しいインサイトを特定し、傾向を予測していくものです。
ビジネスインテリジェンスとは、現在のパフォーマンスの状態を確認するために大量のデータをまとめ、意思決定を促進するために実践的なインサイトを取得するための手法です。つまり、特定の瞬間に何が起こっているかを「説明」するものです。
CDPは、Webサイト、モバイルアプリ、メール、ソーシャルメディアといったソースから顧客データを収集、整理、使用して、一元的な顧客のプロファイルを構築するのに役立ちます。
顧客データを収集し統合的に管理・活用するためのプラットフォームである、CDPについてそのメリットと活用シーンをアニメで分かりやすく解説します!
ダッシュボードとは、データを視覚的に表示したもので、状況の監視や簡単に状況を理解できるようにするために使用されるものです。一般的にダッシュボードには、重要なビジネスプロセスやKPIを説明する複数のインタラクティブな図表があります。
データとは、組織が収集、保存、分析する、ありのままの事実や数字、顧客の名前や連絡先の詳細などの情報です。データは、顧客とのやり取り、調査、センサー、SNSなどさまざまなソースから取得されます。一方、ビッグデータとは、大規模で複雑な情報のことです。ビッグデータには、volume(量)、velocity(速度)、veracity(正確性)、value(価値)、variety(多様性)という5つのVがあり、構造化、非構造化、半構造化の形式で保存、統制、分析するというビッグデータの課題を表しています。
データ分析とは、結論を導き出すために生のデータを検証する技術です。これには、データを理解、集計、可視化しやすくするツールやテクノロジーも含まれています。
「ChatGPT の LLM ってハルシネーションや機械学習バイアスは大丈夫だっけ? 」
この一文を読んで意味が分からなかった方必見、生成AIに関係する用語まとめ集を作成しました!
増え続けるAI用語のキャッチアップにご活用ください。
データカルチャーとは、意思決定を向上させるためのデータの活用を提唱し、重視している個人の共有された行動と信念のことです。データカルチャーによって、データアナリストに限らず誰もがデータでビジネス価値を引き出し、創造できるようになります。
データガバナンスとは、組織がデータの信頼性と関連性を確保するために、データのライフサイクル全体を通じてデータを効果的に処理するためのルールと責任を定義するために使用するフレームワークのことです。これらのルールは、使いやすさ、品質、ポリシーへの準拠、プライバシー、セキュリティを維持するためのプロセスとプロトコルを定義します。
データハーモナイゼーションとは、複数のソースのデータをまとめ、あたかも単一のデータソースのように機能する一元的なデータセットを作成するプロセスのことです。データ要素、形式、構造を調整し、不整合を解消して、データを簡単に比較・分析することが含まれています。
データインサイトは、データ分析から得られるデータのパターンやトレンドといった重要な発見です。リアルタイムのインサイトは、eコマースサイトでの販売といったイベント発生の瞬間に得たデータ分析をもとにした即時の最新情報です。意思決定や戦略の指針としてこれらのインサイトを活用できます。
データレイクとは生データの一元的なストレージレポジトリです。これは、元の形式で大量の構造化、非構造化、および半構造化データを収集、保存するために組織が使用する強大で柔軟性のある低コストのストレージシステムです。データレイクにより、ソーシャルメディアの投稿、センサーログ、ロケーションデータなどの膨大な非構造化データを取得します。
データレイクハウスはデータレイクの拡張性と柔軟性、データウェアハウスの構造とガバナンスという、両方の特長をあわせもっています。このハイブリッドな特性により、データの形式やサイズにかかわらず、組織のあらゆるデータを迅速かつ容易に抽出できます。
データリテラシーとはデータを読み解き、理解し、伝えることができる能力です。
データの活用は大事だと分かっているけど、中々取り組むのは難しいもの。企業を利益率の高いデータドリブン組織へと導くためにデータリテラシーを簡単に、しかも無料で学習する方法をご紹介します!
データマスキングとは、機密情報や個人情報を保護し、プライバシー要件を遵守するために、機密データを架空のデータまたは匿名化されたデータに置き換えるプロセスのことです。データマスキングは、実際のデータを必要としない場合や外部のサードパーティとデータを共有するときのトレーニングやテストに使用されます。AIプロンプトを書くときや、AIモデルをトレーニングするときに個人情報を削除したことを確実にするためにもマスキングを使用できます。
データマイニングは、膨大なデータセットの中のパターンを発見するプロセスです。機械学習、統計、データベースシステムのような技術を使用して、生のデータを有用な情報に変換します。
データサイエンスは、構造化データと非構造化データからインサイトを生成するために、科学的な手法、統計、アルゴリズム、データマイニングの技術を組み合わせたものです。
データセキュリティとは、ユーザー権限やロールベースのアクセス制御のような組織の情報を保護するために使用される手法や手段です。許可された個人だけが特定のデータにアクセスできるようにします。
データストーリーテリングとは、データ、可視化、口頭での説明を通じてオーディエンスにインサイトを伝え、魅力的なストーリーを届けることです。ストーリーテリングを作成してデータナラティブを伝え、状況を提供し、意思決定がどのように結果と関連しているかを提示することも、魅力的な事例を作ることもできます。
データの可視化とは、詳細な図表、グラフ、マップを作成し、情報を理解しやすくするためのプロセスです。これにより、組織はデータのトレンドとパターンを高精度で特定できるので、非技術系の従業員もデータを理解し、把握することができます。
データウェアハウスとは処理されたデータのための巨大な整理されたストレージ場所で、組織は構造化された方法で異なるソースからの情報をデータウェアハウスで収集・保存します。
予測型分析とは機械学習などの統計技術を使用して、過去のデータにもとづいて将来のイベントや結果を予測することです。CRMを使用している場合には、離脱しそうな顧客または特定のプロモーションに反応しそうな顧客の予測も含まれることがあります。
構造化データとは、固定された形式で的確に定義されたデータです。たとえば、スプレッドシートや顧客データベースのように各顧客の列があり、名前、住所、電話番号、メールなどのカラムがあります。構造化データは従来の分析ツールで簡単に理解、検索、機械への読み込みができます。
非構造化データは、事前定義された形式や特定のデータモデルがなく、インサイトの作成には専門のツールを必要とします。非構造化データの例としては、メール、ソーシャルメディアの投稿、オーディオおよび動画、画像、Webページなどが挙げられます。非構造化データは構造化データよりも急速に増加しているので、企業にとって非構造化データをシームレスに分析する技術が不可欠です。
半構造化データは組織的な構造もありますが、そのままでは簡単に分析することができません。構造化データのようにリレーショナルデータベースにインポートするためには、何らかの整理もしくはクリーニングが必要です。
データの重要性はかつてないほどに増しており、広がり続けているデータの流れには管理とガバナンスの重大な責任が伴います。ですが、データには大きな力があります。組織全体で個人のデータアクセスとデータリテラシーを拡大すればするほど、意思決定を導き、類いまれなる顧客体験を生み出すことができるビジネス上の気づきを得られる可能性が膨らみます。AIとCRMでリアルタイムの実践的なデータを組み合わせると、データによってスマートなアクションが促進され、大規模にパーソナライズされた顧客体験の提供が可能になります。
だからこそ、データの本質を理解することが重要となります。企業文化全体にデータリテラシーが浸透すると、誰もがデータを活用して理解を深め、価値を生み出すことができるようになります。
データ分析といえばTableauですが、そんなTableauの使い方やお役立ち情報をまとめたブログ記事をご紹介します。
初心者からTableauのプロまで、皆さんにお役立ちの情報がきっと見つかるはず! ぜひ、ご確認ください!