AIの機械学習と決定木モデル「過学習」を防ぎ予測精度を推し量る

AIの機械学習と決定木モデル「過学習」を防ぎ予測精度を推し量る

今回は「機械学習モデルの作り方」として、業務でも使われることの多い決定木モデルを例にして予測値を算出するまでの流れと精度検証方法についての概要を解説する。世の中のAI(人工知能)と呼ばれているものの中には決定木モデルも含まれており、AIって何でもできそうなイメージを持っていたりする人が「AIとはこんなものなのか」と思っていただけたら幸いである。また、詳細は扱わないが「過学習」と「精度検証方法」についても概要を解説するので、機械学習モデルの精度検証方法のイメージを持っていただけたらと思っている。

  • データサイエンス
  • 2020/10/01
モンテカルロシミュレーションや最適化計算、 リテール分野のCX高次化への応用

モンテカルロシミュレーションや最適化計算、 リテール分野のCX高次化への応用

量子の不思議なふるまいを利用して圧倒的な計算速度を可能にする量子コンピュータ(=量子計算機)は、海外の金融機関も熱い眼差しを注ぐ。金融業界での活用の展望について有識者に話を聞いた。

  • データサイエンス
  • 2020/09/29
PythonやRを使用したデータ分析~データ分析の始め方~

PythonやRを使用したデータ分析~データ分析の始め方~

AI(人工知能)の到来で、より深い情報処理能力が求められる。本稿では初心者向けに、汎用性あるプログラミング言語の分析の仕方を解説する。本連載は、全4回にわたって「データ分析の始め方」、「機械学習モデルの作り方」、「カテゴリ変数の扱い方」、「評価指標を踏まえた運用の仕方」を説明する。会社や部署、趣味などでデータ分析を始めようと思っているが、何からどう初めて良いのか分からない人に向けて、第一歩を踏み出す参考になることを目標とする。

  • データサイエンス
  • 2020/06/22
<特別対談>医療× データサイエンス×アクチュアリー最前線

<特別対談>医療× データサイエンス×アクチュアリー最前線

国や健康保険組合にとって、医療費の抑制は喫緊の課題になっている。特に、糖尿病患者は増加しており、国は糖尿病性腎症重症化予防プログラムを改定するなど対応を進めている。国内外の保険市場でも、健康状態に応じて保険料を決定する商品が発売されており、保険を通じた健康増進の取り組みが加速している。そうした保険のニーズやアクチュアリーの役割などについて、スイス再保険の藤澤陽介氏と医療データの提供・分析により保険事業などをサポートするJMDCの齋藤知輝氏が語り合った。

  • データサイエンス
  • 2019/12/19
データサイエンティスト育成のための産学官による学びなおしの場を提供

データサイエンティスト育成のための産学官による学びなおしの場を提供

ビッグデータ利活用の環境が整備されつつある中、その担い手となるデータサイエンティストが世界的に注目されて久しい。今や各国の政府が将来の国力を左右する材料として重視し、専門人材の育成に本腰を入れ始めた。データサイエンス人材に関する産官学の動きや、世界最高峰のデータサイエンティストが数多登録するプラットフォーム「Kaggle」などを関係者に聞いた。本稿では、文部科学省が超スマート社会の到来に向けてスタートさせた取り組みと、その狙いや目標について解説していく。

  • データサイエンス
  • 2019/10/28
データサイエンスをビジネスに活かすために必要な3つのステージ

データサイエンスをビジネスに活かすために必要な3つのステージ

ビッグデータ利活用の環境が整備されつつある中、その担い手となるデータサイエンティストが世界的に注目されて久しい。今や各国の政府が将来の国力を左右する材料として重視し、専門人材の育成に本腰を入れ始めた。データサイエンス人材に関する産官学の動きや、世界最高峰のデータサイエンティストが数多登録するプラットフォーム「Kaggle」などを関係者に聞いた。本稿では、データサイエンティストとしての質の担保や、実ビジネスにおける利活用に着目し、そのための必要なプロセスについて解説する。

  • データサイエンス
  • 2019/10/23
データサイエンティストの技術指標となるKaggle(カグル)とは~Kaggleを活用した新たなビジネス創出

データサイエンティストの技術指標となるKaggle(カグル)とは~Kaggleを活用した新たなビジネス創出

ビッグデータ利活用の環境が整備されつつある中、その担い手となるデータサイエンティストが世界的に注目されて久しい。今や各国の政府が将来の国力を左右する材料として重視し、専門人材の育成に本腰を入れ始めた。データサイエンス人材に関する産官学の動きや、世界最高峰のデータサイエンティストが数多登録するプラットフォーム「Kaggle」などを関係者に聞いた。本稿では、データサイエンティストの技術力指標の一つとして使われている「Kaggle(カグル)」について焦点を当てKaggleの概要から活用事例を紹介しデータサイエンティストチームとの連携ポイントについて解説する。

  • データサイエンス
  • 2019/10/17
The Financeについて

The Financeは、金融業界のビジネスマンのためのウェブマガジンです。

金融業界向けの講演を数多く手掛ける有名講師陣のご協力により、どこよりも実践的な情報を掲載して参ります。