2023年6月22日(木)開催 INSURANCE FORUM「保険業界におけるデジタルトランスフォーメーション最前線」<アフターレポート>


2023年6月22日(木)セミナーインフォ主催INSURANCE FORUM「保険業界におけるデジタルトランスフォーメーション最前線」が開催された。顧客ニーズの多様化やIT技術の進化により、保険業界を取り巻く環境は大きく変化している。顧客の利便性や顧客満足度の向上に向けて、生損保各社のDXはどのように進めるべきなのか。本フォーラムでは、株式会社かんぽ生命保険、東京海上日動火災保険株式会社より自社のDX戦略の狙いや最新事例をご紹介いただくとともに、協賛企業各社より、保険業界の潮流とデジタルトランスフォーメーションの取り組みについて有益な情報をお届けした。

目次

大規模言語モデルは保険業界のAI戦略をどう変えるのか

【講演者】
株式会社シナモン
事業開発部
保険領域担当
佐々木 奏介 氏

<株式会社シナモン>

株式会社シナモンは、AIに関するコンサルティングサービスを行い、ベトナムのラボにAIの高度人材を100名以上抱えているのが特徴だ。AIを成長戦略に取り込みDXを実現するための知見を提供している。非定型帳票から情報を読み取るAIーOCRエンジン「Flax Scanner」、文書の意味を理解し、情報の抽出やテキストの分類、レコメンデーションを行う「Aurora Clipper」、音声のテキスト化と情報の抽出や分類を行う「Rossa Voice」3つの業務効率改善プロダクトを軸に支援している。DXの導入は一足飛びにはいかない。導入前のワークショップから、全社的なDXの実現までを一気通貫で支援する。シナモンは人材とそれに基づく技術力が大きな強みであり、アメリカの調査会社CB Insightsが選ぶ、2021年の世界で最も有望なAIスタートアップ100社「AI 100」に選出されている。国内保険業界のトップ10社のうち8割と取引があり、保険業界で培ったDX・デジタル化を行える。

<AIーOCRについて>

AI-OCRには人による座標指定を行う「座標定義型」と事前に学習した特徴物を元に指定する「特徴量学習型」の2種類がある。シナモンのFlax Scannerが得意とするのは特徴量学習型で、事前に学習した特徴量を元に読み取るものを特定する。Flax Scannerには、業務に合わせたAI設計が可能なカスタマイズ性、他領域を応用した技術力、定型帳票、非定型帳票を問わず対応できる柔軟性、という3つの特徴を備えている。読取対象の帳票に前処理を実施し、傾きやノイズの除去を実施し、レイアウト分析することで、テキストラインを表示するなど、複合的なAI処理を行い、高い読み取り精度を実現している。ノイズを除去したり、明るさを調整したりすることで、スマホで撮影した粗い画像でもスキャンした帳票とかわらない読み取りをして、きれいにアウトプットできる。保険業界では各社の申込書や申告書などの定型帳票に対応する「Flax Scanner Hub」をプラットフォームで提供する予定だ。

AI-OCRを選定するにあたり、重要なのは品質面で、読み取り速度と精度やコストパーフォーマンスである。とくに重要なのは読み取り精度と速度である。AI-OCRベンダーを選定するにあたり、まずは自社のOCRにどれくらいの手間がかかり、どれだけコストがかかっているかという数字を持った現状把握が先決だ。正確な現状把握によって、AIーOCRを導入後の成果が正確に認識できる。

実際にAI-OCRを導入しても、現時点の技術力で、100%人手をなくすのは現実的に難しい。しかし、AI-OCRの導入によって帳票を直接画像データ化することで、社内のチェック体制を2〜3名で社内DBへ保存できるようになる。

<大規模言語モデル及びとその問題点について>

現在、OpenAI社のChatGPTに代表される大規模言語モデルが話題になっているが、BERTなどは従来から存在した。大量の学習用テキストデータにより事前学習された自然言語処理を行うモデルである。大量のデータを利用し学習することで精度面でのブレイクスルーが生まれた。また単一タスクではなく比較的汎用的な処理が行えるようになっている。 ただし、問題点もある。大規模言語モデルは確率的に正しそうな回答文を生成する仕組みである。人間に評価所謂「いいね」をもらうためにアルゴリズムができている。そこには論理性は一切ない。そのため、業務利用においては、論理的な精度や説明性の観点が欠けているという懸念がある。個人的にはChatGPTは、これからもどんどん進化していくとは思うものの、基本的な成り立ち自体に論理性が欠けているため、いつまでも論理性が生まれることはない。シナモンでは、論理性が欠けたままの業務利用は難しいと考えている。一方で、ChatGPTは今後業務で使われるであろうし、業務に使わない手はないとも考えている。

また精度面や論理性だけでなく、モデルに起因する問題やセキュリティ面にも不安がある。では、どのようにChatGPTを使えばいいのだろうか?

<Chat-GPT 活用に向けたシナモンAIの取り組み>

シナモンが大規模言語モデルを研究する中で糸口が見えてきた。大規模言語モデルが得意とする「まるで人間が書いたかような文章作り」に対し、論理性、説明性、正確性などの弱点を補う仕組みを付随して、ChatGPTの弱点を補完すれば業務利用も可能だと結論した。それが実現すれば、CRMのデータ、顧客とのやりとり、報告書などの企業に眠る非構造データを拡張して、シミュレーションAIやCX向上AIなど業務に沿ったAIを作り出すことができるだろう。

<大規模言語モデル活用のユースケース>

今回紹介するユースケースは各種照会対応の自動化である。現在のチャットボットでも顧客からの質問に対する回答は実装されているが、ここにChatGPTの機能が付け加わるとどうなるだろうか? チャットボットの回答欄をクリックすると、答えの根拠となるデータが参照できるような仕組みが考えられる。この仕組みを実現するには、まず保険会社の約款をAIによって構造解析し、関係性を抽出する。一方で、蓄積された過去の問い合わせをAIでQA抽出して関係性を抽出する。それぞれ関係から抽出されたものをナレッジグラフというものを使って、関係性を構築する。それを大規模言語モデルに投げてチャットボットの回答を実現する。ナレッジグラフとは、様々な知識を体系的に連携し、グラフ構造で表現した知識ネットワークである。ナレッジグラフを組み合わせることで、回答の説明性がクリアになり、必ず特定の情報量がないと正確な回答が出せなかったチャットボットが、抽象的な質問にも回答できるようになる。

たとえば、質問で「コロナで入院しました。いくら支払うべきでしょうか?」という質問をChatGPTに投げたとしても回答しない可能性が高い。なぜなら、保険会社の約款ではコロナを特定感染症という言葉で明記しているからだ。ChatGPTは急にコロナと言われても認識できず、チグハグな返答をする可能性が高い。そこで、質問と返答の間にアダプターの役割を果たすナレッジグラフをかますことで、正確な回答を促す。ナレッジグラフがChatGPTにとって辞書のような役割をすることで、コロナ=特定感染症だと認識し、正確な回答を促せる。

常識的な問いであればChatGPTでも回答できるが、特に保険業界では会社独自の専門用語や仕組みの専門知識が多いので、回答が難しくなる。そこで会社専門のナレッジグラフを組むことによって、最適なプロンプトを組み、ChatGPTもよりよい回答ができるようになる。

しかし、ナレッジグラフの構築にも課題がある。コロナ=特定感染症のような例が大量にあり、それを1つずつ作成していくのは膨大な作業になる。ナレッジグラフの概念自体は1950年代からあるが、それが実現しなかったのは、人手で構築するのが不可能だったからだ。

AIによるナレッジグラフの半自動化の可能性が高まり、メンテナンス性も維持される。また約款の関係性抽出にも課題がある。約款や各種マニュアルには表構造のものが無数にあり、人間にとっては分かりやすい図表だが、AIにとっては分かりにくいものになる。そこで、活かされるのが冒頭で紹介したAI-OCRの技術だ。AI-OCRで培った表を認識する技術を元に、図表の関係性を抽出することができる。これはシナモンのナレッジグラフ研究の技術的優位になっている。実際に実験をしてみても、ChatGPTに何も学習させずに保険関連の質問をさせても回答率は約10%だったのに対し、ChatGPTにルールブックやナレッジグラフをかますことで回答率は約60%以上になった。さらにナレッジグラフの上にAI-OCRの技術を加えると回答率は80%以上になった。

保険業界だけでなく業務では正確性が求められる。したがって正確性が担保できないままChatGPTを業務利用するのはおすすめできない。しかし、シナモンのナレッジグラフやAI-OCRのような技術で正確性を担保することで、マーケティング、引受、支払い、など保険業界の様々な側面での活用が期待できるだろう。

◆講演企業情報
株式会社シナモン:https://cinnamon.ai/

1 2 3 4 5 6
よかったらシェアしてね!
  • URLをコピーしました!
  • URLをコピーしました!
目次