1. HOME
  2. データサイエンス
  3. データサイエンスをビジネスに活かすために必要な3つのステージ

データサイエンスをビジネスに活かすために必要な3つのステージ

ビッグデータ利活用の環境が整備されつつある中、その担い手となるデータサイエンティストが世界的に注目されて久しい。今や各国の政府が将来の国力を左右する材料として重視し、専門人材の育成に本腰を入れ始めた。データサイエンス人材に関する産官学の動きや、世界最高峰のデータサイエンティストが数多登録するプラットフォーム「Kaggle」などを関係者に聞いた。本稿では、データサイエンティストとしての質の担保や、実ビジネスにおける利活用に着目し、そのための必要なプロセスについて解説する。

データサイエンスをビジネスに活かすために必要な3つのステージ
  1. データサイエンティストの質を担保するKaggle
  2. 実ビジネスにおけるデータサイエンス業務
  3. データサイエンスの利活用に必要な3つのステージ

データサイエンティストの質を担保するKaggle

従来、データサイエンティストのスキルを測る手段としては、オープンソースの開発経験の有無や、ソフトウェア開発プラットフォームGitHubで公開したコード、技術ブログといったもの以外はあまりなかった。そのような中で、2010年に設立されたKaggleはデータ分析のスキルを競い合うことに特化したプラットフォームだ。Kaggleで高成績を維持するには、時代に合った新技術へのキャッチアップが常に求められるため、Kaggleにおける成績順位はデータサイエンティストとしての質を担保する機能があると言える。

Kaggleの上位ランク者たちが2012年に立ち上げた米国のスタートアップ企業のDataRobotは、経験豊富なデータサイエンティストが必ずしもいなくても、解決したい課題に合った最適な予測モデルを構築できるオートML(機械学習)を提供する。同社の製品は、国内の製造業や金融機関に多数導入されている。

実ビジネスにおけるデータサイエンス業務

アクサ生命保険 MCVP統括部 HPM推進室 シニアデータアナリストの平松雄司氏は、「将来的に、データサイエンティストは、オートMLソフトウェアを開発するような機械学習エンジニアのようなケースと、各専門分野で活躍する現場のエキスパートがデータサイエンス業務を兼任するようなケースとに二極化していくだろう」と語る。

「データサイエンティストは自由な社風を好むタイプが多い。優秀な人材ほど各社からの引き合いが強く、制限の多い、分析環境があまり良くないような業界に定着させることは至難の業だ。その点、保険業界に関しては、これまで数理や分析などを担ってきたアクチュアリーがデータサイエンス業務を兼任するほうが、データサイエンスの活用が円滑に進む可能性は高い。例えば、新技術によるプライシングロジックが適用可能かどうかなどの判断は従来の商品設計に精通していないと非常に難しい。新旧双方の仕組みを理解する人材の需要は今後も増していくだろう」(平松氏)

本来、データサイエンティストは、業務・経営課題を各関係者と協議して見出し、分析モデルの構築およびデプロイ(実際の運用環境で展開)、効果測定および改善を行うPDCAサイクルを回すものだ。分析をもとにした施策がビジネスのサービス改善、収益改善につながっているかといった成果が問われることになる。一方、Kaggleは分析モデルの構築という、データサイエンスのプロセスの一部に特化しているため、実ビジネスにおいて求められるスキルを全て満たしているわけではない側面がある。その点に留意しつつ、Kagglerをうまく社内のデータサイエンスの利活用のためのプロセスに取り込むことが重要となるだろう。

データサイエンスの利活用に必要な3つのステージ

データサイエンスをビジネスに活かすためには3つのステージが必要となる。まず、分析をするのに十分なデータがあり、社内データベースのインフラが整備されていること。次に、人材がきちんと確保できていること。最後に、組織間の壁が可能な限り払拭されていて、PDCAサイクルを回すことができることだ。

平松氏は、「一般的に、これまでのAIプロジェクトの成功率は10%にも満たないと言われている。つまり、ほとんどの企業がAIプロジェクトに失敗する。こうした事実を認知したうえで、3つのステージを整えておくことは重要だ。GAFAなど米IT大手はどのステージも重要視している。だからこそ、ビジネスにおいてデータサイエンスを有効に活用できているのだろう」と説く。

日本の産業発展のためには、経営層もデータサイエンスへの理解を深めることが不可欠だ。最低限の基礎知識がないと、誤ったAIへの投資や指示で会社のリソースを消費し、その結果、優秀な人材が流出するなどのリスクも大きくなる。日本の保険業界は、少子高齢化や人口減少、低金利、若年層の車離れなどの影響で、国内市場は将来的にも縮小傾向にある。

「打開策として業務の効率化や海外展開などが挙げられる。海外の場合、保険に対する規制が比較的緩い国もあり、日々得られるデータをもとに保険料を変動させるダイナミックプライシングを採用する保険会社も存在する。こうした商品には、データサイエンスが活用されてることも珍しくはないのが実情だ」(平松氏)

データサイエンスカテゴリのオススメの記事
AIの機械学習と決定木モデル「過学習」を防ぎ予測精度を推し量る

今回は「機械学習モデルの作り方」として、業務でも使われることの多い決定木モデルを例にして予測値を算出するまでの流れと精度検証方法についての概要を解説する。世の中のAI(人工知能)と呼ばれているものの中には決定木モデルも含まれており、AIって何でもできそうなイメージを持っていたりする人が「AIとはこんなものなのか」と思っていただけたら幸いである。また、詳細は扱わないが「過学習」と「精度検証方法」についても概要を解説するので、機械学習モデルの精度検証方法のイメージを持っていただけたらと思っている。

モンテカルロシミュレーションや最適化計算、 リテール分野のCX高次化への応用

量子の不思議なふるまいを利用して圧倒的な計算速度を可能にする量子コンピュータ(=量子計算機)は、海外の金融機関も熱い眼差しを注ぐ。金融業界での活用の展望について有識者に話を聞いた。

PythonやRを使用したデータ分析~データ分析の始め方~

AI(人工知能)の到来で、より深い情報処理能力が求められる。本稿では初心者向けに、汎用性あるプログラミング言語の分析の仕方を解説する。本連載は、全4回にわたって「データ分析の始め方」、「機械学習モデルの作り方」、「カテゴリ変数の扱い方」、「評価指標を踏まえた運用の仕方」を説明する。会社や部署、趣味などでデータ分析を始めようと思っているが、何からどう初めて良いのか分からない人に向けて、第一歩を踏み出す参考になることを目標とする。

<特別対談>医療× データサイエンス×アクチュアリー最前線

国や健康保険組合にとって、医療費の抑制は喫緊の課題になっている。特に、糖尿病患者は増加しており、国は糖尿病性腎症重症化予防プログラムを改定するなど対応を進めている。国内外の保険市場でも、健康状態に応じて保険料を決定する商品が発売されており、保険を通じた健康増進の取り組みが加速している。そうした保険のニーズやアクチュアリーの役割などについて、スイス再保険の藤澤陽介氏と医療データの提供・分析により保険事業などをサポートするJMDCの齋藤知輝氏が語り合った。

【 インタビュー 】
アクサ生命保険
MCVP統括部
HPM推進室
シニアデータアナリスト

平松 雄司 氏

The Finance をフォローする
注目のセミナー すべて表示する