AIモデル開発ではなぜ「試行錯誤」が必要なのか

このエントリーをはてなブックマークに追加

はじめに

こんにちは、データデザイン部でディレクターをしております中野です。

私たちはAIモデルの開発を行っていますが、モデル開発の中ではある程度の「試行錯誤」が必要となります。それは、複数ある手法を、課題や目的、データに合わせて試していくためです。PoCだけでなく本番用の開発フェーズにおいても、プロジェクト開始時点の想定手法に固執しすぎない柔軟な進め方がお客様の課題解決につながる方法ではないかと考えています。

そこで今回はAIモデル開発ではなぜ「試行錯誤」が必要なのかというテーマで、AIモデル開発やプロジェクトのお話をさせていただきます。ご覧になる方が、プロジェクトをどのように進めるべきか考える助けとなれば幸いです。

目次

1.AI活用プロジェクトの進め方概要

以前のブログ記事でもご紹介はしておりますが、AI活用の基本プロセスは以下の4つのフェーズに分けることができます。

    (1)企画フェーズ:プロジェクトの企画を立てる
    (2)検証フェーズ:実現可能性を確かめる
    (3)本開発フェーズ:AIモデルを本格的に開発する
    (4)運用フェーズ:AIを業務に活用する

企画フェーズでは、目的や課題の明確化、手段の選定や費用対効果の試算などを行います。このとき、必要なデータに関しても評価しておく必要があります。なぜなら、AIモデルを開発しようとした時に、想定よりもデータ量が足りないことや、データの質が悪かったということがないようにするためです。企画ができたら、実際に検証するフェーズ(PoC)を実施し、実現可能性を確かめた上で本開発、運用へとフェーズを進めていきます。

プロジェクト全般にいえることかも知れませんが、はじめから進め方や方法が確定できていることが望ましく、全工程が当初想定の通りに進むのが一番、と考えます。しかし、実際のところは期中で変更や調整を余儀なくされることがあります。

AI活用プロジェクトにおいて、今回のテーマである「試行錯誤」は検証フェーズで特に発生し、時に本開発フェーズにおいても必要となるケースがあります。プロジェクトの進め方としてこれを考慮に入れおく必要があります。

ではなぜ「試行錯誤」が必要なのか、次項で説明いたします。

2.試行錯誤が必要な理由

企画フェーズにおいて、AIモデルを開発するための学習データや手法を定めて計画します。次の検証フェーズ(PoC)では定めた学習データと手法を検証します。このとき、初回の検証から「当初期待した結果(精度)」が得られるとは限りません。なぜなら、結果は学習データの質や量により変わるため、検証してみるまでわからないのです。つまり、施行する前の段階からあらかじめ結果を見込むことは困難なのです。

AIモデルを開発するデータサイエンティストは、検証すること自体に責任を持ちます。そのため、計画時はいくつかの手法で検証する計画を立てています。より細かく述べると、データの前処理や統計手法、機械学習、ディープラーニングのアルゴリズムを試行する計画を立てます。検証する方法の数にもよりますが、これらは複数方法の組み合わせとなるため、端的にいうと手間がかかります。そのため、計画時に試行錯誤の手間をどれだけかけられるかを見込んでおく必要があります。

プロジェクトは、決められた期間と予算の中で遂行する必要があります。しかし、AIモデル開発はデータの定義書やデータを受領するだけで完遂できる訳ではありません。大事なことは、試行錯誤をどのようにマネジメントするかだと考えます。

次項では「試行錯誤」期間の進め方について、説明いたします。

3.PoCフェーズをどのように進めるべきか

まず、進め方に関して、以下どちらかに決めてしまうことが肝要と私は認識しています。

    1.あらかじめ定めた手法のみで検証する
    2.手法を定めながらも、可能な期間と工数の中で検証を繰り返す

1は試行錯誤を極力減らして、プロジェクト期間をコントロールします。
2はプロジェクト期間が許す中で、試行錯誤を行うことを前提に計画を立てます。

進め方が1なのか2なのか曖昧なままですと、プロジェクトが上手く進行できなくなる可能性が出てきます。例えば、期待した結果が得られずプロジェクト期間が延びてしまうような事態です。

私が担当しているプロジェクトでは、2の方法で遂行することをご提案し、実行しています。許されたご予算の中で、期間と工数を定めた上でより望ましい結果が得られるように勧めます。つまり、必要な試行錯誤をあらかじめ盛り込んでおくのです。これらをプロジェクトに関わるメンバーが認識して、遂行していくことが大事だと考えています。

4.まとめ

AIモデル開発の結果がデータに依存する以上、プロジェクトにおける試行錯誤は必要なことだと捉えています。当然、短い期間と少ないコストで結果が得られることは大事です。しかし、複数の手法を試していくことが、AIモデル開発においては、中長期的により望ましい結果を得られるものであると考えております。もしご興味ございましたら、ぜひ一度お問い合わせください。

【無料ebookのご案内】
AI・データ活用がうまく進まない方におすすめの一冊です

年間多くのお客様からAI・データ活用に関するご相談いただきますが、中にはプロジェクトを立ち上げる前に終息したり、スタートできるまでに半年以上時間を要するケースもあります。
その最大の要因は、データの準備不足です。

AIプロジェクトを開始するためにはAI活用に適した形でデータが揃っていることが大前提ですが、この大前提ができていないケースが多くあります。
では、どうすればAI・データ活用プロジェクトを効率よく推進できるのでしょうか。

本ebookでは、企業が陥りやすいデータの3大課題と、その解決に役立つ「AI活用診断レポート」について、わかりやすくご紹介いたします。
無料でダウンロードできるのでぜひご活用ください。

ebookダウンロードはこちら

WRITER
Hiroki Nakano

ディレクター

中野   広基 Hiroki Nakano

ディレクター 中野 広基 Hiroki Nakano ニフティ株式会社 新卒入社。マーケティング部門にて、会員情報のデータ集計、分析 社内向け分析ツールの運営。 現在は富士通クラウドテクノロジーズにて、ディレクターの立場で上記に関連する様々なデータ分析プロジェクトを実行中。JDLA Deep Learning for GENERAL 2019 認定スクラムプロダクトオーナー

SNSで最新情報を発信しています

最新記事

ページTOPへ