いま、いくつかの企業に対してAI・IoT導入に関するコンサルティングを行っているのですが、そうした活動の中で思ったことがあります。
それは、この記事のタイトルに掲げたとおりで、機械学習の特徴量の設計と、KPIの設定は似ているということです。
KGIとKPI
多くの企業は経営を行うにあたって、経営目標を立案し、その達成に向かって日々の活動を行っています。経営に限らず、何らかのプロジェクトでも目標があり、そのために活動しています。
目標はKGI(Key Goal Indicator)とも言います。どんな指標がどの程度達成されれば目標を達成したと判断できるかです。KGIに対してKPI(Key Performance Indicator)もあります。KPIは、KGIを達成するための中間指標で、定期的な進捗管理の中で、KPIがどのような実績値を示すかを見て、KGIの達成が可能か否か、順調か否かを判断するわけです。
KPI=説明変数(のうち内部要因)
ここで、KGIのことを目的変数、KPIを説明変数と言い替えても良いかもしれません。機械学習や統計学の世界では、求める値を目的変数、目的変数を求める際に使用する値を説明変数と言います。説明変数を特徴量と言うこともあります。例えば、ある画像を犬、猫と判断する際に、なぜ犬と思ったか、猫と思ったかをどう説明するでしょうか。ヒゲがあるとか、色がどうだとか・・・といった特徴が考えられるでしょう。そうした特徴となる項目を説明変数(特徴量)と言います。同様に、売上を予測する、来客人数を予測する際にも説明変数(特徴量)があります。それは、営業に回った数かもしれないし、同一商品の値付けかもしれません。
そうした説明変数の設定が正しければ、正しく予測できる可能性は高まりますが、誤っていればおそらく予測も誤ります。それと同様のことがKPIにも言えます(正確には、説明変数は自社の努力でどうにかなる内部要因に限らず、景気とか国際情勢といった外部要因も含めなければならないので、KPIは説明変数のうち、内部要因にあたるものと言った方が良さそうです)。KPIの設定が正しければKGIの達成が近づくし、誤っていればKGIの達成は遠のいていくでしょう。色眼鏡で経営を見ていては、ダメだということです。
データを見つめる眼力
ただ、特徴量を特定するのは難しいことです。何かの物事について、この値を見ておけば物事の有り様が分かる・・・といった値が特徴量なので、それを探し出すのが難しいのは当然でしょう。逆に言えば、それができる実力があれば、非常に価値があります。KPIを正しく設計できる力、より良い機械学習モデルを開発できる力となるからです。データを見つめる眼力を養うことが重要な時代になったということかもしれません。