株式会社SBI証券におけるデータ活用の取組み

特別講演

【講演者】
株式会社SBI証券
執行役員 データマネジメント室長
喜志 武弘 氏

株式委託手数料に依存しない事業基盤の確立

インターネットをフルに活用した証券事業を中核とし、「顧客中心主義」という経営理念を追求しているSBI証券。業界最高水準の手数料で業界最高水準のサービスを提供するため、2023年9月30日よりオンラインでの国内株式の現物取引、信用取引の手数料を無料化する「ゼロ革命」をスタートさせた。次いで、2023年12月1日からは、米ドル円のリアルタイム為替取引に係る為替手数料もゼロとしている。さらに、2023年までの現行NISAで取引手数料を無料としている国内株式、海外ETFに加え、2024年の新NISAからは新たに米国株式の個別株や、海外ETFの売却注文も手数料無料の対象とする予定だ。

ゼロ革命の結果として、約200億弱の手数料収益が見込めなくなる。喫緊の経営課題となるのが「株式委託手数料に依存しない事業基盤の確立」だ。

SBI証券が営業収益に占める委託手数料の割合は、委託手数料以外の金融収益、引受募集売り出し手数料、トレーディング損益と収益の多角化を進めることで年々低下。2024年3月期第1四半期時点で22.9%となっている。

こうしたデータ分析の解像度を高め、どこの投資を強化し、どこのコストを節約するか、経営の意思決定に貢献するアウトプットが必要となる。そこで2つのことに着手した。

1つ目は、データによる事実の把握。経理財務担当役員と連携し、PLなど財務三表の正確な経営数値を入手するとともに、インターネット証券事業を一つの事業セグメントとして設定。インターネット証券事業の管理会計上のPLをデータマネジメント室で作成した。

2つ目は、インターネット証券事業のビジネスモデルを整理。経営指標を実現するために投資判断が必要な事項、投資判断をするためのKPI(Key Performance Indicator)の全体像を洗い出し、インターネット証券事業の管理会計上のPLとの論理的な結びつきを整理した。

AI/機械学習で「とにかく何かをやろう」は無駄な投資の可能性

金融業界でAIやDX活用を促進していこうとする際、「需要予測」「解約予測」「不正検知」などをテーマにする傾向が見られるが、こうした予測がPLにどのような影響があるか、経営数値との論理的な関係を把握しないまま進めることは危険だと考えていた。

例えば、AIや機械学習を使って働きかけると効果的なユーザーセグメントを洗い出して、獲得に動いたり、解約を防止して、維持管理したりしたする。しかし、実際の売上データを冷静に分析して、これらのユーザーセグメントがもたらす売上利益を確認してみると、赤字が拡大しているような場合もある。場合によっては、機械学習のために投資した金額の分だけコスト増になる恐れもある。

ビジネス的なトレンドだとはいえ、明確な目的を設定しないまま、AIや機械学習を使ってとりあえず何かをやろうとしても無駄な投資になってしまう恐れが高い。

こうしたことを極力回避するため、インターネット証券事業のビジネスモデルと管理会計上のPLとの論理的な結びつきからデータ分析を行う方向性を決めた。

データ活用の取組みにおける課題と克服

2022年にデータマネジメント室を新設し、SBI証券のデータ整備やデータ活用状況について調査したところ、3つの課題が浮かび上がった。

まず「データ定義にばらつきがあること」。次に「財務三表とユーザーセグメントの関連把握が不十分」。最後に「顧客要望の定量を把握するのが困難」だ。

◆データ定義のばらつき
正しいデータ定義は、正しい数値把握、正しい意思決定の基礎になるため、地味ながら重要度は高い。しかし、一部の組織では、データの定義についての異なる例が発生していたため、見ている数値にばらつきが発生し、全体の整合性が取れていなかった。さらに、SQLを記述できる人材が社内で限られていたことで、データの抽出にかかる工数が大きくなり、データの分析やデータを踏まえた意思決定に時間を要してしまっていた。

こうした課題を解決するために、KPIの基礎となるデータ地図やKPIの抽出を効率的に行えるデータマートを作成。加えてインターネット証券事業の顧客向け商品サービスの口座、約定売上残高を様々な集計軸で自由に抽出できるツールを開発した。環境を整備することで、SQLを記述できない場合もデータを有効活用できるようになった。新しい商品が生まれるたびに新しいデータ定義が必要になるため、現在も日々継続している。

◆財務三表とユーザーセグメントの関連把握が不十分
ユーザーデータとPL上の利益を結びつけた分析がなく、インターネット証券事業のビジネスモデルと、管理会計上のPLとの論理的な結びつきが不十分だったため、売上利益貢献度の高いユーザーセグメントの特定が甘くなっていた。

そこで、改めてSBI証券の1000万口座を大きく5つにカテゴライズ。「閉鎖済み口座」「インターネット以外の対面取引口座」「売り上げのない口座」「売り上げの高いロイヤルカスタマー」「売り上げのある口座」の5つのグループにまとめた上で、細かくセグメントを分け、最終的に502のセグメントに分類した。具体的には、2021年7月から2022年6月、2022年7月から2023年6月の1年間ずつのユーザーセグメントの状況を比較。口座数、売上成長率という観点で抽出した140のセグメントを評価し、特徴的なセグメントに属する口座の属性や各セグメント間の遷移を分析したのだ。合わせて特徴的なセグメント間遷移をしている口座の属性、男女、預かり資産の多寡などのデモグラフィック情報、行動情報などを分析した。

これらの分析から得た1000万口座のユーザーセグメントに関するデータと、インターネット証券事業の管理会計上のPLを結びつけることで、売り上げのないユーザーセグメント、売上利益貢献度の低いユーザーセグメント、売上利益貢献度の高いユーザーセグメント、各ユーザーセグメント間の遷移状況を可視化し、売上利益貢献度の高いユーザーセグメントと、そこに遷移するユーザーセグメントを正確に把握した。

可視化された遷移ルートや、各セグメントの特徴量、統計量を用いた要因分析をもとに、売上利益貢献度が大きいセグメントに遷移させるための中長期的なアプローチを実施する基礎を作り上げた。

ユーザーセグメントの分析は継続することで推移が分かるので、定期的にモニタリングを実施し、インターネット証券事業の事業担当者がいつでも把握できる仕組みを構築。アプローチを強化すべきユーザーセグメントを可視化した。

◆顧客要望の定量を把握するのが困難
顧客が何を求めているのか、どのような要望を持っているのか、正しく把握できなければ、期待に沿うことはできない。これまでは、カスタマーセンターに届く問い合わせや要望を目視でExcelに分類していたが、その工程では要望の存在は把握できても、その定量を把握することは難しい。

お客さまから、どういったサービスの改善を強く求められているのか定量的な把握をすることが困難だった。そこでNLP(自然言語処理技術)を用いて顧客要望にタグを付け、付与されたタグの数から優先度を決めることで、要望を定量的に分析できるように工夫した。

データ活用の取組みの現在

データ活用の取組みにおける課題と克服に注力した結果、現在はデータ活用の取組みに進捗が見られている。KPI定義の共通化および抽出を自由化。そこからデータマート、KPIダッシュボードを整備した。把握が不十分だった財務三表とユーザーセグメントの関連も、売上利益貢献度の高いユーザーセグメントと、そこに遷移するユーザーセグメントを正確に把握し、顧客の要望「ボイスオブカスタマー」も定量的に把握した。

社内で常に正しいデータが把握できるように、各種のツールなども整備。例えば、SBI証券口座の全体基礎情報の全社員による把握を目的とし、全社員向けに月1回「SB証券ユーザー白書」を発行。1000万口座の男女比、都道府県比率などが把握できるドキュメントになっている。

次に、顧客要望や苦情に関する情報は、サービス改善に役立てることを目的に、「VOC Auto Labeler」というAIで自動分類。商品別チャンネル別、時系列で分析可能なツールを社内向けに提供している。

他にも社内向けにKPI可視化ダッシュボードや売上利益セグメント分析ツール、SBI証券の全ユーザーの口座属性取引資産などの情報を一つのテーブルに結合したデータマートなどを社内向けに提供。商品間のクロス分析も可能になるように口座、商品ごとの約定残高も可視化して、サービスの数値を日々把握してもらおうと図っている。

こうした基礎をもとに、現在はDID、Difference-in-differences、差分の差分法という手法にて、ゼロ革命の影響シミュレーションを精緻に行っている。データを正確に把握して売上利益貢献度の高い顧客を知り、顧客の生の声を知るという基礎中の基礎から改めて出発することが、次の高度な分析の基礎になるだろう。

分析の基盤ができたので、今後はAIやDXへの対応を促進し、個別のテーマ対応に着手する予定だ。インターネット証券市場の約50%のシェアを占めるSBI証券だけに、市場シミュレーションなどの高度な分析やシミュレーションにも取り組んでいきたいと考えている。