人工知能(AI)・機械学習のサービス・コンサルティングならブレインパッド

TOP > 人工知能(AI)ブログ > データ活用・アナリティクス > データサイエンティスト > 【インタビュー】ビジネス活用のための機械学習

【インタビュー】ビジネス活用のための機械学習

2019年3月1日

Twitter

Facebook

 

最近聞く機会が増えた「機械学習」という言葉。「全く聞いたこともない」という方から「なんとなく知っている」という方まで、ご自身の仕事や生活に今後どのように関わっていくものなのでしょうか。

本インタビューでは、元々は物理学の研究者、そこからデータサイエンティストに転身し、分析官・PMとキャリアを経て、現在では研究開発に取り組んでいるアナリティクスサービス本部 シニアリードデータサイエンティストの今津義充に機械学習の現状と今後の展望について話を聞きました。ブレインパッドでは多くのプロジェクトに関わってきているからこその失敗談なども聞くことができました。

機械学習とは?

機械学習の概要についてまずはお話を聞いてみました。

 

そもそも機械学習とは何でしょうか?

一言で言ってしまえば「人の知見を介在することなく、データの中に隠れているパターンを機械的に発見する」手続きということです。この手続きを通して、データから知見(パターン)を自動抽出するのです。全ての答えはデータの中にあるということになりますね。・・・自分で言っておいてあれですが、少しわかりにくいですかね。(笑)

機械学習ではない手続きとの違いで説明してみますね。
たとえば、自社から目的地のお客様先まで車で向かって打合せを行うことを考えましょう。夕方3時にお客様先で打ち合わせがあるとき、何時に自社を出発したらよいでしょうか。お客様先は各地にあり、かつ、一日何度もこの出発時間の意思決定を行わなければならないとしましょう。Webやアプリは無しとして、です。

この意思決定を効率的に行うためには、目的地と出発時間(必要なら追加情報)を与えると、妥当な到着時間を出力してくれるような“機能”(関数)が一つあれば使い回せて、効率が良さそうです。さて、皆さんなら、このような機能(関数)をどのように作るでしょうか。

我々は日々の経験から、区や地域の粒度で距離が概算できるな、とか、都内なら一般道でだいたい20km/時ぐらいだな、とか、金曜日の夕方だし渋滞する可能性が高いから想定移動時間を1.5倍しておくか、などと考えて、到着時間を概算するかと思います。機能としては、“目的地情報から概算距離を決定し、その他の情報から1.5倍を決定し、概算距離を1.5/20倍する処理で必要移動時間を算出し、出発時間情報に加える”、という計算処理の流れですね。

この例のように、我々は問題を分解したり、自分や周りの過去の経験からなんとなく当たりをつけることで、ある程度妥当な計算処理を定め、意思決定につなげることができます。逆にいえば、“人(の知見や経験)を介在(利用)する“点がこの状況下での機能構築には本質的に重要になっています。

我々は日々業務で様々な処理や意思決定を行っていますが、それらの処理も基本的には、このような事前に人によって規定された処理、“ルール“の集合によって成り立っています。身近なところでは、勤怠システムや社内稟議システムなどもそうです。コーディングをされたことがある方々には馴染み深い観点かと思います。

一方、機械学習は上のような処理の手続きを人の知見や経験に基づく代わりに、入力(目的地と出発時間など)とその実際の出力(実際の到着時間)の履歴データのみから、自動で構築します。データの中に潜む、入出力の間のもっともらしい構造や関係性(1.5/20など)を機械的に探索して自動決定するのです。データから知見を自動抽出する、と述べた理由です。

一つの機能を構築する際に、機械学習はデータに基づきボトムアップで、既存処理は人の知見に基づきトップダウンで、構築するというアプローチの違いとご理解いただくのがよいかもしれません。(それぞれのアプローチには一長一短あると認識いただくのも重要かと思います。)

図:著者作成

機械学習はどのようなことができるのでしょうか?

技術の発展によって、今までは人でしか担えなかった作業のうち、相対的に単純な繰り返し作業を機械で置き換えることが可能になりました。人と同じように学習して複雑な処理パターンを学習できるようになってきているのです。

例えば「画像認識」です。今までは、画像を見て「これは東京の画像」、「これはフランスの画像」という感覚や把握は人間しかできなかったものです。しかし、最近では機械もできるようになってきました。

「予測」も同様です。「明日は雨が降るかどうか?」という問いに対して、人は過去の情報や経験などから感覚で答えを導きます。これも機械で置き換えることができるようになってきました。

人も何かを判断するときに過去の情報の蓄積から判断していると思いますが、それと同じようなことを機械が人の介在なく過去のデータのみから知見を自動構築しすることで、実行できるようになってきたのです。

 

なぜ今、機械学習が注目されてきているのでしょうか?

“可能性を感じている”という部分が大きいのではないかと思います。上記のような特性を持つ機械学習によって、機械で置き換えられる可能性のある手続きや業務、その典型事例が増えてきました。これらによって、業務観点からも、コスト削減、人手不足解消、生産性向上など、機械学習適用による具体的なビジネス上の恩恵が得られそうだ、という感覚が醸成され始めて来ているように感じます。

単純作業は機械に置き換えて、人にしかできない仕事をしていきましょう、人はアウトプットの価値を上げていきましょう、という流れです。この流れは決して今に始まったものではなく、機械化、IT化などの技術革新に沿って、昔から絶えず続けられてきたものです。例えば、昔は人が自力で伝票などの計算をしていましたよね。でも今は、Excelに任せて簡単に計算していると思います。Excelに単純処理を任せることで、より複雑な処理を構築できたり、結果を考察する時間を増やしたり、人にしかできない仕事を増やせるようになりました。今、機械学習が注目されていることも、単純作業を機械に置き換えましょうという流れの一種であり、近年の技術革新によって従来は難しかったより高度な処理が置き換えられる可能性が見えてきている、と捉えていただければ良いと思います。

 

完全に人間の仕事が機械に置き換わる時代は来るのでしょうか?

人間の仕事を完全に機械に置き換えることは、現段階では難しいと思っています。人の認識はまだまだ奥深いんですよね。人は私たちが考えているよりも柔軟性があり、複数の情報から物事を効率的に判断しています。ただ、一部の作業に特定すれば人間の力を凌駕している部分も出てきています。それはAlphaGO(囲碁の人工知能)のようなもので、時間と効率を考えてきちんと作りこめば人を超えるまでになってきています。

一方、機械学習の技術は現在も急速に発展している只中にあります。その技術進歩は、既存技術がより詳細に縦に深くなると同時に、様々な技術が提案され、横への広がりもみせています。つまり、一つの技術がその領域の中で深化しており、また技術の種類も増えて応用範囲の広がりができていることです。それら技術の柔軟な掛け合わせによって、より複雑な課題を解決することができるようになってきています。点と点がつながるイメージで技術がどんどん進化していっています。

コンピューター、Webによる技術革新が起こった際と同様に、それら未だ発展中の技術の特性を理解した上で、上手く組合せて活用し、業務プロセスやビジネスを再構築することを考えることが重要だと思っています。

機械学習プロジェクトの失敗談から学ぶ成功するための注意点

ここまで機械学習の基礎について話を伺いました。続いて、いざ機械学習プロジェクトに取り組むとなった時、知っておいた方が良いこと、気を付けておくべきポイントを聞いてみました。

 

ご自身の機械学習PJの経験で失敗談などはありますか?

もちろんありますよ。失敗というより、プロジェクトの途中で何度も目的が変わってしまうようなケースでは思うような成果が出ないことが多いです。目的が変わると、手法もアウトプットも変わります。限られた期間でプロジェクトを行う中で、途中で方向転換が起きると必要な工数が増え、期間内に目的を達成できないこともあります。ですので、達成すべき目的が明確ではないお客様には、事前にビジネス課題をヒアリングしながら目標設定のサポートを行っています。

目的を明確にした後は、お客様とユースケースをイメージしながらアウトプットはどのようなものになれば良いか、人に置き換わるためにはどれくらいの精度が出ないと使えないなどの詳細を決めていきます。機械学習から得られたアウトプットが、どのように実際の業務に使われるかを確認し、それを導くために正しい手法がきちんと結びついているかどうか、取り組み粒度や発展計画は適切かどうか、は常に意識をしています。

 

機械学習を実際のビジネスに適用する際の注意点はありますか?

従来のシステムや機能とは違い、データの質と量・試行錯誤の時間などによって結果はかなり変わるため、実現機能の発揮性能についての概念検証プロセス(PoC)がどうしても必要になってきます。何となく実現可能性について勘みたいなものはありますが、実際にやってみたら精度よくできた!というものもあれば、逆に思っていたより精度が高くならなかったということもあります。また、最近ではPoCをやってみたが上手くいかず、PoCを繰り返す「PoC貧乏」という話も聞きますが、大体の場合は目的と手法が直線で結ばれていない、もしくは実務適用にむけて取り組むべき粒度が適切でないケースが多いと感じます。AIや機械学習については言葉のイメージが先行してしまい、期待が高まりがちです。今では少なくなりましたが、何でもできるスーパーマンみたいなイメージを持っている方がまだまだいらっしゃると思います。ただ、今までお話したように明確にスコープを絞って、PoCを実施し、まずは疑似実務環境下での結果を出すことが重要だと感じています。

データ分析について熟知しているコンサルタントが、何に基づいてお客様が業務判断をしているのか、業務についてきちんと理解しなくてはいけません。何をもとに判断しているかは扱っているデータ以外から参照している可能性もあるので、しっかりヒアリングをして意思決定に必要なデータがきちんとそろっているかの確認も重要ですね。実はこんな知見が入っていて・・・みたいなことが後から出てくるとモデルを作り直さなければなりません。このように機械学習に基づく機能には人が介在しないからこそ、業務適用を検討する際には、人が判断するべき範囲や判断基準などを詳細に事前に確認する必要があります。

データサイエンティスト、データコンサルタントが知る機械学習のノウハウと対処法

世間では「機械学習はブラックボックス」と言われていますが、その機械学習プロジェクトにおいて、プロジェクトを成功に導くためのデータサイエンティストたちのノウハウや対処法とは一体どのようなものなのでしょうか。

 

機械学習はブラックボックス?だとしたら分析官(データサイエンティスト)は何をしている?

違いが現れる点としては、大きく分けて二つあるかなと感じています。一つはビジネス課題に適切な手法を選択する場面、もう一つは構築したモデルを改善していく場面、です。

まずは、適切な手法を選択する場面関してです。一般的に機械学習はブラックボックス(判断している根拠がわかりにくい)と言われていますが、機械学習には様々な手法があるので一概に全てがブラックボックスなわけではありません。そして、ブラックボックスで良い場合もあれば、悪い場合もあります。いわゆるブラックボックスと言われる多層ニューラルネットワーク(深層学習)は複雑度が高く、解釈が難しいのですが精度が高い傾向があります。一方で、回帰や決定木といった手法は解釈がしやすいかわりに精度が低くなりがちです。

図:回帰と決定木(韮原祐介「いちばんやさしい機械学習プロジェクトの教本」をもとに作成)

このように、解釈と精度はトレードオフの関係にあり、目的に合わせて手法を選択することが大切なのです。マーケティング施策の検証では精度の高さを優先するより「なぜこの施策が効果があったのか?」という理由が解釈できないと困りますよね。次にどんな打ち手が必要かの判断できません。ですが、不良品検知だと「なぜこれが不良なのか?」という理由の解釈というよりは、不良を見逃さないという精度が重視される傾向が強いです。しかし近年、この解釈と精度のトレードオフを解消しようとする試みは、深層学習の文脈でも積極的に模索されていますので、今後の発展が注目されます。

次は、構築したモデルを改善していく場面です。一般的にはブラックボックスと言われている機械学習において、精度を高めるためにモデルを改良することは難しいとされています。何の要素がどれだけモデルに影響しているか解釈しにくいからです。ただし、ブラックボックスであってもブレインパッドの分析官はチューニングのコツを知っています。例えるならギターの弦を緩めたらどのような音が出るか、逆に締めたらどう音が変化するか、はある程度わかっているのです。ですので、精度の低いモデルに対しても改善策はわかっていて、この要素を加えると良さそうという知見があります。

AIや機械学習は、先進的な大企業の中にもまだプロジェクトの継続的な推進に必要な知見が少ない分野かと思います。そのため創業以来15年以上、データ分析を生業としてきた我々ブレインパッドへのご相談が多く、頼りにしていただけていると感じますし、非常に嬉しくも思います。

これからもこの知見を活かし、今後も様々なお客様からの要望に対して課題解決に取り組んでいきたいと思っています。

編集後記

機械学習についていかがでしたでしょうか。「機械学習とは何か?」「機械学習プロジェクトとはどんなものか?」など疑問を持たれていた方に少しでも参考になれば幸いです。

インタビュー中では「機械学習プロジェクトには目的が明確である必要がある」とありましたが、私の印象としては、最初から目的が明確な状態でご相談にいらっしゃる企業様は決して多くはない印象です。実際は、社長や上司から「AIや機械学習で何か取り組みをしなさい!」と言われ、担当者の方が困って弊社にご相談いただくケースが多いように感じます。そもそも担当者の方がAIや機械学習で何ができるのかがわからない場合もありますし、一体自社ではどのような取り組みであれば費用対効果高く取り組めるか勘どころがない場合が多いからです。

ブレインパッドでは、何を取り組むべきかの“テーマ選定”についてデータコンサルタントがワークショップを通してご支援致します。お客様と一緒に課題やテーマを議論しながら、費用対効果が高い、データが揃っているなど様々な観点からデータコンサルタントがアドバイスをして、取り組むテーマの洗い出しと優先順位をつけていくものです。実際にこの“テーマ選定”を行ったのち、実プロジェクトとして引き続きご依頼をいただいているケースもあります。些細なことでも構いませんのでお気軽にご相談下さい。

Twitter

Facebook

このエントリーをはてなブックマークに追加