データの活用について思った事：AIの活用の記事を読んで

日経新聞「データの世紀」2018年9月30日に、日本の主要113社に「AIの活用状況」を聞いた結果が掲載されていました。

大林組の「地質変化機械診断」に使えるようになるために「AIの目開発」に投資した期間は約2年だそうです。

AIの実践化の壁として高かったのは「保管されているデータ形式」。

社内に保管されているデータがPDF形式だったりXLS形式だったりとバラバラなため、担当者が手作業で「データを再入力」する必要があったとか。

AIは入力されたデータをもとに色々な計算を行わせて「その意味を学習させる」プロセスが不可欠です。そしてそのプロセスを経て、AIとしての精度を高めていきます。

しかし調査では、「データはあるが使えない」「データが収集できていない」「そもそもどんなデータが必要がわからない」という企業の悩みが続きます。

その一方で、データ収集が済みAIをうまく動かせても「ブラックボックス化」というところに不安が残ります。つまり、AIで得られた結果についてそれを活用する人が「説明できない」というパラドックスですね。

その昔、私が某メーカーのエンジニアだったころ、実験計画法や品質工学、検定などの統計手法を使ってデータ分析やシステム最適化をしていたのを思い出しました。

今のAIほどの難解さはないものの、線形代数や二乗和を使ったやり方はそれなりに難しくて理解しにくいものでしたから、やはり「ブラックボックス」的な発言はあったような気がします。

とはいっても、何とか電卓でも計算できないことも無いから、ある程度しっかり勉強すればそれぞれの数式の目的などを理解する事はできました。

その後、ビッグデータやデータマイニングという言葉が出現するようになって、膨大なデータを入れればそこから何らかを「発見」できるという事がもてはやされました。

これこそ、そのアルゴリズムを使う人にとっては、まさに「ブラックボックス」。

まぁ、AIもその流れにあるといえなくもありませんね。

僕は、それを使用する人達が演算アルゴリズムをきちんと理解する事は難しいと思います。

金融工学にしても、それこそノーベル賞レベルでの数式が使われている事からもそう感じます。

では、どうするか？

入力するデータと出てきた結果との違和感を洞察できるくらいの「知識」と「経験」と「思考力」を持つことが前提でしょう。

つまり「そもそもどんなデータが必要かわからない」というのはナンセンスなのです。

入力データとそこから得られた結果。

得られた結果が「予想外なもの」だったら、そのアルゴリズムを疑う前に、入力データを疑ってみること。入力データをいろいろと変えてみて、そこから得られる結果を再検証すること。

入力データが良くなければ、そこから得られる結果は全然信用できないものになるという事実は、AI時代の今ではなく、実験計画法の時代から言われている事です。

だから新聞の表題にあった「動かない頭脳」ではなく、「頭脳を動かすためには」という視点を持った方が良いのではないか？

と、そんなことを台風の風に耐えながら思いました。

台風はこれから関西-東日本に向かう様子です。

十分な警戒をしてお過ごしください。

最新記事