AIの機械学習と決定木モデル「過学習」を防ぎ予測精度を推し量る

AIの機械学習と決定木モデル「過学習」を防ぎ予測精度を推し量る

今回は「機械学習モデルの作り方」として、業務でも使われることの多い決定木モデルを例にして予測値を算出するまでの流れと精度検証方法についての概要を解説する。世の中のAI(人工知能)と呼ばれているものの中には決定木モデルも含まれており、AIって何でもできそうなイメージを持っていたりする人が「AIとはこんなものなのか」と思っていただけたら幸いである。また、詳細は扱わないが「過学習」と「精度検証方法」についても概要を解説するので、機械学習モデルの精度検証方法のイメージを持っていただけたらと思っている。

  • データサイエンス
  • 2020/10/01
モンテカルロシミュレーションや最適化計算、 リテール分野のCX高次化への応用

モンテカルロシミュレーションや最適化計算、 リテール分野のCX高次化への応用

量子の不思議なふるまいを利用して圧倒的な計算速度を可能にする量子コンピュータ(=量子計算機)は、海外の金融機関も熱い眼差しを注ぐ。金融業界での活用の展望について有識者に話を聞いた。

  • データサイエンス
  • 2020/09/29
ポストコロナ時代にデータセンターはどう活用すべきか

ポストコロナ時代にデータセンターはどう活用すべきか

【PR】新型コロナウイルス感染症により、社会の在り方は大きく変わった。また、リモートワークの普及によって多くの企業がシステムのクラウド化を検討している。クラウドとデータセンター、双方の強みとシステムの特性を踏まえながら、基盤整備を進めていくことが求められる。では、データセンター活用の要諦はどこにあるのか。本稿ではColtデータセンターサービスがまとめたホワイトペーパー「ポストコロナにおけるデータセンターの活用方法」から、この点について一部を解説していく。

  • サイバーセキュリティ
  • 2020/09/01
PythonやRを使用したデータ分析~データ分析の始め方~

PythonやRを使用したデータ分析~データ分析の始め方~

AI(人工知能)の到来で、より深い情報処理能力が求められる。本稿では初心者向けに、汎用性あるプログラミング言語の分析の仕方を解説する。本連載は、全4回にわたって「データ分析の始め方」、「機械学習モデルの作り方」、「カテゴリ変数の扱い方」、「評価指標を踏まえた運用の仕方」を説明する。会社や部署、趣味などでデータ分析を始めようと思っているが、何からどう初めて良いのか分からない人に向けて、第一歩を踏み出す参考になることを目標とする。

  • データサイエンス
  • 2020/06/22
<特別対談>医療× データサイエンス×アクチュアリー最前線

<特別対談>医療× データサイエンス×アクチュアリー最前線

国や健康保険組合にとって、医療費の抑制は喫緊の課題になっている。特に、糖尿病患者は増加しており、国は糖尿病性腎症重症化予防プログラムを改定するなど対応を進めている。国内外の保険市場でも、健康状態に応じて保険料を決定する商品が発売されており、保険を通じた健康増進の取り組みが加速している。そうした保険のニーズやアクチュアリーの役割などについて、スイス再保険の藤澤陽介氏と医療データの提供・分析により保険事業などをサポートするJMDCの齋藤知輝氏が語り合った。

  • データサイエンス
  • 2019/12/19
The Financeについて

The Financeは、金融業界のビジネスマンのためのウェブマガジンです。

金融業界向けの講演を数多く手掛ける有名講師陣のご協力により、どこよりも実践的な情報を掲載して参ります。

注目のセミナー すべて表示する