ビッグデータを活用した分析・機械学習・深層学習の活用について話せます
■キーワード
ビッグデータ, 機械学習, 深層学習, 時系列データ, 画像認識, データ可視化, 地理空間情報, 気象データ, 衛星データ, TensorFlow, Keras, scikit-learn, Light-GBM, R, Python, Pandas, Numpy, Matplotlib, GIS
■背景
時系列データを活用した最先端の機械学習・深層学習的手法について京都大学大学院博士課程で研究しており、並行してデータサイエンティストとしてのデータ分析や機械学習モデル開発といった業務を行っております。
現在の一般的な機械学習・深層学習を使えば、どこまでならできるのか、あるいは何ができないのか。活用範囲や手法は常に変化しており、機械学習に携わる専門家ですら、ある程度のスタンダード的な解決はあるものの、全容を正確に把握することが非常に困難な状況になっており、専門家以外の方にはなおさら大変な労力が必要な状況であると言えます。データ分析は、背景に数学や統計学の知識と素養が求められるため、たとえツールやプログラミングコードをマニュアルどおりに動かせたとしても、結果の解釈やその意味するところを正確に理解して、実際の業務に生かすことは、非常に専門性の高い作業となります。特に扱いの難しい時系列データ分析はその傾向が強く、専門的スキルや豊富な経験を有する人材不足が顕著になっています。しかし企業や社会的組織の持続的発展にとって日々蓄積されていくさまざまなデータ(その多くは時系列データです)をどのように経営に生かすかは、死活問題として認識されつつあります。課題の整理や第三者の客観的意見など、専門的スキルを持つデータサイエンティストとして、またアプリ開発者として、これまでに多くのデータ分析(主に時系列データ)やアプリ開発に携わってきた私の経験が少しでも活かせれば幸いです。
■話せること
まず、インフラ・基盤構築・環境・クラウド製品・業務自動化についてのご相談は、データ分析から離れる別ジャンルのトピックになり、私の専門分野ではないため対象外になります。お話ができる範囲としては、ツールはGoogle Colab や Jupyter Notebook、R Studio 等を使い、TensorFlow, Keras, scikit-learn といったフレームワークで、どのようなデータ分析やモデル構築・推論ができて、そこから何を読み取ることができて、それをどのように経営判断や販売計画などの実務に生かせるかといった範囲になります。
■データ分析・機械学習・深層学習の事例
具体的なデータ分析事例をご紹介します。
・売上データのトレンド・季節周期などの時系列データ解析および将来の予測モデル構築
・気象データと観光データ等から将来の予約者数・売上を予測するDeepLearningモデル構築およ び顧客クラスター分析
・Covid19 / 新型コロナ感染者数関連データの分析および可視化
・モバイル空間統計(NTTドコモ)を用いた時系列人口分布分析 ・「訪日外国人消費動向調査」データによる国別宿泊費額に着目したインバウンド顧客クラスター分析
・過去の気象データから予測を行うDeepLearningモデル構築(電力消費量の予測、農作物の収穫高の予測など)
■ 関連する論文やブログ等があればURL
・これまでの実績および著書の紹介(https://deepkick.com/)
・Github (https://github.com/deepkick)