【後編】AI開発における自社データの価値を確かめるたった1つの方法

このエントリーをはてなブックマークに追加


こんにちは、データデザイン部でディレクターをしております加藤です。

普段はお客様の事業課題に合わせ、AI・データ活用を軸に課題解決プロジェクトを推進したり、自社の新規サービスを企画、推進したりしています。
今回は、【前編】AI開発における自社データの価値を確かめるたった1つの方法の続編になります。まだご覧いただけていない方はまずこちらをご覧ください。

目次 – 後編

デモ:「データアセスメントレポート」提出までの流れ

「データアセスメントレポート」は実際どのようなお客様がご利用されるのか、具体的な想定利用シーンを交えて提出までの流れをご説明します。

【再掲】想定利用シーン

前編と重複になりますが、想定利用シーンは以下と設定します。

  • 業界    :不動産会社
  • 課題    :勘と経験に頼っていた中古マンションの取引価格査定をAIに代替したい
  • ご提供データ:2019第三四半期の世田谷区のデータ(※国土交通省提供のオープンデータ

まず、ご提供データを開いてみると以下のようになっています。

少しデータを見るだけでわかるのですが欠損があることや、間違ったデータ入っている可能性がありそうです。一般的なデータサイエンティストであればここから、EDA(探索的データ解析)を行い、手作業で欠損値を把握したり、カラム同士の相関をみたり、解析していきます。前編で述べた通り、一般的にはここにかなりの工数を要します。

データは弊社独自のデータ確認システムですぐにアセスメント可能

しかし、弊社には独自のデータ確認システムがあり、データを入れるだけで以下の3つの情報が見れるようになります。

特長①:アセスメントサマリを日本語で表示

まず、1つ目の特長として、アセスメントサマリを”日本語”で表示してくれます。以下をご覧いただければわかりやすいです。

このように、カラムのデータサイエンス観点での要点をすぐに表示できます。欠損値、相関関係等が一目瞭然です。

特長②:各カラム細かい特徴まで表示可能

2つ目の特長は、見たいカラムについて、詳細な特徴を把握することができる点です。たとえば、今回の課題は取引価格査定なので、予測したいカラム(目的変数)は、「取引価格(総額)」となります。そのカラムのデータについてコーディングなしで、要約統計量とヒストグラムが下記のように表示されます。

特長③:課題と解決策の提示を最小限の工数で可能

データサイエンティストが手を動かして行っている初期の作業を上記のように自動化できることにより、考えるべきタスクに集中できます。例えば今回のデータでいうと、以下のようなアクションを考えることができます。

  • 1. 予測に使用したい[建物の構造]や[間取り]の欠損が多いので、なぜ多いのかヒアリングし、お客様と欠損値の埋め方を議論する
  • 2.[延床面積(㎡)]と[面積(㎡)]は高い相関があるので、両者に違いをヒアリングし、予測に使用するべきデータを選択する
  • 最後にレポート形式にまとめてご提出

    上記のようなアクションのように、お客様とのディスカッションに注力できることで、お客様のビジネス課題の解決にはデータ的に何が課題でどう解決すべきかをまとめることができます。最終的には議論の結果をレポートにまとめてご提出となります。

    「データアセスメントレポート」後の流れ

    「データアセスメント」を終えたあとステップとしては、大きく2種類あります。パターン①はデータとして、大きな問題なく開発を進められるケースで、「AIモデリングサービス」の適用を検討します。パターン②はデータそのものに問題が多いためデータの整備から行うケースで、「データエンジニアリングサービス」を検討します。それぞれ、以下にご紹介します。

    パターン①:「AIモデリングサービス」へ

    AIモデリングサービスに関しては、以下のブログで詳しく紹介しています。今後はよりお客様が使って頂けるような形で拡充する予定ですので、楽しみにお待ちいただけると幸いです。

    【前編】用途特化型のAIモデルを開発する「AIモデリングサービス」とは?3つの特長をご紹介!

    【後編】用途特化型のAIモデルを開発する「AIモデリングサービス」とは?6つのラインアップとユースケースをご紹介!

    パターン②:「データエンジニアリングサービス」へ

    データエンジニアリングサービスは、表立ってパッケージングされているわけではないですが、以下のブログのイメージを持って頂けると幸いです。

    データ分析基盤の基本と構築のポイント


    目的に応じた分析基盤を構築し、AI等に使えるデータを整備する基本的な考え方になります。

    まとめ

    後編では、「データアセスメントレポート」の具体的な活用方法と、その後の流れについて述べました。とくにその後の流れついては、弊社が型化に注力しているところでもあるので、またブログ等で紹介していければと思っています。

    最後までご覧くださりありがとうございました。

    5月26日開催 無料ウェビナー デモから学ぶ 製造業界のための『画像解析AI』活用術

    2020年5月26日に、無料ウェビナー「デモから学ぶ 製造業界のための『画像解析AI』活用術」を開催いたします。

    今回は近年AIの需要が高まり導入も進んでいる「製造業界」の方向けに、特に注目を集めている『画像解析AI』について、その活用術を実際にデモを交えながら解説いたします。

    ウェビナーの詳細については以下のフォームからご覧いただけます。ご興味ございましたらお気軽にお申込みください。

    詳しくはこちら

    データアセスメントレポート 資料ダウンロード

    今回ブログでご紹介した「データアセスメントレポート」について、詳しい資料をご用意しております。
    無料でダウンロードしていただけますので、この機会にぜひご覧ください。

    資料ダウンロードはこちらから

    AIモデリングサービス 資料ダウンロード

    「AIモデリングサービス」についても、詳しい資料をご用意しております。
    無料でダウンロードしていただけますので、この機会にぜひご覧ください。

    資料ダウンロードはこちらから

    WRITER
    Daiki Kato

    ディレクター兼プランナー

    加藤 大己Daiki Kato

    主にメーカーやサービス業のAI・データ活用プロジェクトを複数推進。また、新規AI・データ活用サービスの企画・推進も担当。 JDLA Deep Learning for GENERAL 2017

    最新記事

    ページTOPへ