日本ソフトウエアの強み
AI技術におけるビジネスプロセス
1.データ分析からAIビジネス導入のフレームワーク
当社では、AIプロジェクトを立ち上げてビジネス適用するには、ビジネスの理解とデータ分析が重要と考えております。実際にデータ分析を行う際は、試行錯誤してゆく中で最適な結果へと結び付けてゆくことになります。また、1回のプロセスで完了するのはなく、得られた結果を次のデータ分析へとつなげてゆくことになります。
2.プロセスの課題
扱う代表的なデータは、「構造化データ」もしくは「非構造化データ」です。データの形式によって、前処理に使用する手法は大きく異なります。
構造化データ例
- 帳票データ
表形式でデータを表現できる
顧客データや購買履歴など表形式で扱えるものを指します。この種類のデータは従来からのデータベースで管理しやすいという特徴があります。
非構造化データ例
- 音声データ
- 画像データ
- テキストデータ
表形式でデータを表現できない
非構造データは、主に画像、音声(自然言語)、文章の形式で表されます。構造化データより容量が大きく扱いが難しいという特徴を持っています。
データの前処理は多くの場合、プロセスの7割から9割を占めます。データを以下に表現するか(どのように特徴量を作成するか)、がモデルの精度を左右し、分析の目標を達成できるかどうかにつながるため十分な作業時間が必要になります。
3.評価
モデル作成フェーズで得られた結果から、分析の目標とビジネスの目標を達成できるか評価します。
つまり、作成したモデルを使って予測結果の根拠を説明できるかを検討します。
予測精度の高いモデルと、根拠を説明しやすいモデルのどちらが相応しいか、2つの関係はトレードオフです。
ビジネス目的を達成したかは、定めた基準に対して結果から具体的なアクション(打ち手)につなげられることを確認します。
評価の結果、ビジネス目的を達成できなければ、ビジネス理解のフェーズに戻って再度、分析の目標と判定基準を設定します。
また、データ準備のフェーズに戻って再度作成、モデル作成フェーズに戻ってモデルを再度作成することもあります。
4.開発費用
機械学習に必要な費用は、教師データ作成のための費用、ニューラルネットワークなどのモデルの設計や適用検討の工数、機械学習のためのオンプレミスのGPUやクラウド使用でのインフラ費用などがあります。
ディープラーニングの場合は、大量に準備しなければならない教師データの作成のための工数、許容するトライ&エラーの回数、学習時間を短縮できるように使用する並列処理を実現できるインフラの費用などを考慮します。
5.プロジェクト運営課題
機械学習やディープラーニングによる開発では、通常のシステム開発と異なるアプローチを行うため、開発マネジメントには独自のノウハウが必要になります。
それには、作業工程の分担や、完成する人工知能の提供形態、最終成果物の所有割合などに注意が必要です。特に開発リスクマネジメントにおいては、開発ステージが進むにつれ、作業人員と期間との交換可能性が変化することに気を付けなければなりません。
判定器としての人工知能は、「データを入力すれば、データが出力されるブラックボックス」です。
つまり、人工知能を業務で使用する処理やフロントエンドがないと、実際には使用できないためアプリ開発が必要です。
つまり、「AIというパッケージがあって、それを使うだけ」です。よく、近い将来「ソフトウェア開発」はなくなるのではないか?という考えがありますが、「ない」ということです。
AIモデル自体の開発はとても高度ですが、AIを分類器として組み込んで、前処理、後処理をアプリ開発したシステム開発は多くのニーズがあります。「AIは難しい」ではなく、AIを活用したシステムが考えられる手掛かりになれば幸いです。