連載
» 2018年06月18日 09時00分 公開

製造業のIoTスペシャリストを目指そう(11):データ駆動社会における「データ分析の基礎知識」 (1/2)

IoTというと「つながる」ことを意識しがちですが、その本質は「データを活用すること」にあります。ではデータを活用するためには、何を知っておくべきなのでしょうか。今回は「データ分析の基礎」について学びます。

[IoT検定制度委員会,TechFactory]

はじめに

 IoT(Internet of Things)という言葉だけでは、「モノがインターネットにつながる」という狭義で捉えがちです。IoTの本質は、つながったことによりデータを取得し、そのデータを有効活用するところにあります。

データ駆動社会

 IoTの意味を広義に捉え第四次産業革命の中で生き残っていくためには、これからの社会がデータ駆動社会に変わっていくことを認識する必要があります。すなわち、IoTでつながることによって収集したデータを元に、価値のある判断をする必要があります。変化のはげしい時代において、過去の経験や勘だけに頼っていては生き残れないでしょう。製造業においても、工場や企業内で発生していることをデータ化し、データを基に判断を進めなければ、正しい考えに到達できないと思われます。つまり、データが付加価値創出の中核になっていきます。

 これは、「ビッグデータ社会」の基本でもあり、下記のCPS(Cyber Physical System)の考え方でもあります。また、CPSを進展させたといわれるデジタルツインでも同様です。デジタルツインについては、こちらの記事(IoTスペシャリストを目指そう:第10問 IoTシステムによる生産管理(2)「デジタルツイン」を理解する)も併せて参照してください。

CPS(Cyber Physical System)の概念(出展:経済産業省) CPS(Cyber Physical System)の概念(出展:経済産業省)

データ分析の基本

 それでは、それらのデータはどのように分析すれば良いのでしょうか? AI(人工知能)でしょうか? もちろん、第四次産業革命ではAI、特にディープラーニングの存在感が高くなると思われますが、ここではまず、基本となる考え方について触れたいと思います。

  • (1) これからのデータ駆動社会においては、全ての担当者がデータ分析技術の基本は身につけておく必要がある。
  • (2) データサイエンティストといわれるようなデータ分析のスペシャリストが、企業内の業務改善やビジネス変革のリーダーシップをとり、イノベーションを起こす必要がある。

 今回は(1)におけるデータ分析技術の基本について言及したいと思います。皆さんの中には、(2)に関連する話をネットなどで読み、データ分析はハードルが高く、投資が必要だと思われている方も多いのでは無いでしょうか。ですが、おなじみのExcelでもかなり高レベルなデータ分析が可能です。

 Excelでは、相関分析(2つのデータにおいて関連性があるかを判断)や回帰分析(相関関係があると思われる2つの変数の傾向を分析することで、将来的な値を予測するための回帰直線を求めるための手法)を簡単に実施できます。データ分析にリソースを割きにくい中小製造業などにおいては、Excelだけでもかなりの「データ分析」が実行できます。

Pythonによるデータ分析

 言及したようにExcelでも基本的なデータ分析は可能ですが、さらに進んだ方法としては、データ分析のライブラリが豊富なプログラム言語である「Python」を使う方法があります。Pythonは無料で入手できるOSS(オープンソースソフトウェア)であり、PCさえあれば機械学習やAI(人工知能)の用語として頻繁に登場するクラスタリング(clustering)やクラス分類などを実施することが可能です。

機械学習プラットフォーム

 また、各プラットフォーマ―が提供している機械学習/AI(人工知能)プラットフォームでは、クラウドで各種のAIが利用することが可能です。このプラットフォームを利用するための知識や技能の習得は、ExcelやPythonによるデータ分析と比べ難易度が上がりますが、どのプラットフォームでどのようなことができるのかは基本的な知識として知っておくべきと思います。

プラットフォーム名 主な実現可能な内容
AWS(Amazon Web Service) 機械学習/視覚/言語/チャット
Microsoft Azure 機械学習/視覚/音声/知識/検索/言語
Google AI 機械学習/動画分析/画像分析/音声認識/テキスト分析/翻訳
IBM Watson 機械学習/会話/画像/音声/言語/トーン

今回の問題

 それでは、IoT関連の知識・スキルアップに役立つ問題を出題します。今回は、上記のデータ分析に関連する問題です。

問題(11)

 データ駆動社会においては、データを有効活用することが求められています。データを有効活用するためには、データを適切に分析する必要があります。次のデータ分析に関連する内容として、最も正しいものを1つ選びなさい。

 

  1. 2つのデータの間に相関関係があれば因果関係があるといえる。
  2. データ分析に活用可能なプログラミング言語のPythonは、「Microsoft Windows」「macOS」「Linux」などのOS上でも動作させることが可能である。
  3. データを分析する際の「クラス分類」は、いくつかのかたまりにグループ分けする方法であり、教師無し学習である
  4. データを分析する際の「クラスタリング(clustering)」は、事前に正解が決まっている属性に割り当てる教師有り学習である。

※本連載の設問が実際のIoT検定にそのまま出題されるわけではありません。

       1|2 次のページへ

Copyright © ITmedia, Inc. All Rights Reserved.

Loading