「あおぞら銀行におけるマーケティングデータの『見える化』事例」

淺川 将範 氏
【講演者】
株式会社あおぞら銀行
インフラストラクチャーマネジメント部 システムインテグレーション第四グループ グループ長
淺川 将範 氏

<はじめに>

現在、様々なデバイスの進化やインターネット環境の充実により顧客接点が多様化し、時代とともに進化するスピードも加速している。銀行においても対面利用だけでなく、インターネットバンキング等多くのサービスを非対面でご利用いただいている状況だ。今回は当行が取り組んできた様々なデータの収集から分析、データの見える化までのシステム観点における事例を紹介する。

<あおぞら銀行とは>

当行は設立から65年目となり、コンパクトな規模かつグローバルな業務展開をしており、ユニークで専門性の高い金融サービスを展開しているのが特徴だ。職員の距離も近くスピーディーな意思決定力も強みとしている。現在はお客さまの数も増加し、数年前に比べ当行をご存知の方も多くなっていると感じる。

<Tableau導入の背景>

当行では個人向けの新マネーサービス「BANK」を2019年7月から開始した。また、スマートフォン向けアプリのサービスも開始したことによりお客さまが増加し顧客層も変化している。様々な目的を持つお客さまに対してどのようなサービスを展開すれば喜んでいただけるかを知るためには3点が課題であると認識した。1つ目はサービスの拡大に伴い情報の幅、データの量が膨大になっている事、2つ目はシステム毎に情報が分断される傾向があり、全体俯瞰ができる横串のデータ分析が難しいこと、3つ目はデータを「見える化」するまでの作業プロセスが多く、視覚的なデータ確認が難しいことだ。これらの課題を解決するにはまず各情報の整理・集約が必須であり、その先にデータの見える化、データドリブンでの利活用に繋がる。

<課題解決に向けた取り組み>

まずはステップを3段階に分け土台作りから取り組んだ。ステップ1は幅広いデータを集め、データの土台部分を整理すること。ステップ2は集約したデータをいかに使いやすいデータに加工するかといった、データ分析の土台となる加工方式や主軸のデータモデルを決める部分であると定義した。ステップ3ではインフラ・アプリ両面で全体を効率よく動かせるシステム構成を検討するため、臨機応変にリソースが分散できる部分として定義した。現在当行では現状分析から予測分析へ向かっていくべきと考えており、データドリブンなデータ利活用を推進したいと考えている。

<実装ステップ概要①各情報の収集>

散らばったデータを大きく分類すると、Web行動ログ等のインターネット関連データと取引データ等の基幹系システムデータの2つに分けられ、それぞれ異なるデータの特性を持つ傾向があると考えており、それぞれの特性に合わせ効率的に集約するため、分析システム群を新規構築した。

まずインターネット関連データはログベースであり、リレーションの重要度は低いためHadoopベースでの列指向データベースを採用。行内システムはリレーションを重要視した厳密性が保てる行指向データベースを採用した。おおもとでデータベースタイプを分けることで、長期的に利用でき臨機応変な対応ができる構成となっている。

<実装ステップ概要②情報集約・加工>

異なる列指向・行指向のデータベースを持っているが、データを主として考慮した結果、どちらも「DataLake」「DWH(データウェアハウス)」「DataMart」の3層に分ける事が最適と考えている。まずは目的に適した元データをデータの粒度が細かいままDataLakeに格納している。ここで粒度を粗くしてしまうとデータ分析をする際に分析の幅を狭めてしまうためだ。次にDWHでは溜め込まれた情報を使える状態に整形することがメインとなり、主軸となるデータモデル群のみを定義し必要に応じてDataLakeを活用すればよいという考え方のもと整理をしている。データの幅は抑えつつ目的に応じて主軸となるデータモデルを構築し、目的別のDataMartのテーブルを生成しているのだ。

<実装ステップ概要③データの見える化・分析>

当行では効率的なデータの見える化の実現のため、DataMart層としてTableau Serverを主とし新規構築した。導入した利点としては、SQL言語を介さなくても視覚的にデータを参照でき、対話的な分析だけでなく定型的な分析においても深掘った分析をすることができる点が挙げられる。また結果をTableau Server上で共有可能という点も利便性が高い。システム観点では、Tableau内ではHyperという形式でデータを保持しており、Hyperを利用した分析が高速であること、また分析時にRDB基盤のデータベースへアクセスをしなくてもTableau Server内で分析を完結ができることが利点といえる。億を超える行数規模であっても多角的な分析が可能になった。

<現在の基本的な利用イメージ>

基本的な分析用途はTableau Serverとなり、分析者はそちらにアクセスしに行くことが基本だ。新たな分析利用用途が出てきても、どこの枠に収めて実現するかを検討しながら、どのサーバに寄せて組み込むかの選択肢がある状態だ。

クライアントが増加しTableauブラウザ経由アクセスが増加した場合でも、影響範囲はTableau Webサーバ内での完結が基本だ。クライアントからのリクエスト毎に毎回Hyperの全量を読込にいくわけではないため効率的にサーバリソースを消費できる。

「Live分析」として、Tableau Webサーバを介して他のDBを参照する機能もある。定型化されていない分析イメージとなり、データ分析に特化した人が新たな分析を作っていく利用用途だ。

SQL分析者利用時の影響範囲は、Tableauサーバではなく、直接DBを参照していく形だ。具体的にはDataLake、DWHに対して複雑なSQLでレポーティング分析する用途で利用しており、SQLエンジニアに限って利用している。

<「データの見える化」効果と今後の展望>

Tableau Serverの導入により「使えるデータ」がより身近になったと感じている。具体的には、土台となる分断されていたデータが結合・加工するだけではなく「使えるデータ」が視覚的に見えるようになり、活用幅が向上した。次にデータへのアクセスが身近になった。Tableau Serverを介して、ガバナンスを保ちながらデータアクセスできるインターフェースができ、SQL分析者でなくてもデータ参照できる人が増え、分析が身近になった。さらに、データ分析結果の共有が可能であることにより、分析しながら開発が進められ、分析結果をTableau Server内で共有することで業務効率化にもつながった。今後に関しては予測や統計、AIといった要素を組み込み、分析の高度化を進めていくことを検討している。

<最後に>

データの収集と加工といった土台を整えた先にデータ分析があるという点については、デジタルマーケティングに関わらずデータ分析で共通する考え方である。1つのデータベースに全て詰め込むのではなく、特性に応じて利用できるものを組み合わせることが分析の幅を広げるためには肝要で、全体を俯瞰しながら考えていくことが必要であると考える。