定期的に登壇している翔泳社グループのSEプラスさんの研修で、受講体験レポートのブログを書いてもらいました。
SEプラスさんではいくつかの研修に登壇していますが、新講座の「Pythonによるデータ前処理と機械学習」を受講いただいたものです。
この講座では、自動車の価格予測をモチーフに、Pandasでのデータ分析と前処理、scikit-learnでのモデル開発、さらにPyCaretを使ったローコードでのモデル開発までを順に体験していきます。
体験レポートでも取り上げていただいているのが「AIの民主化」というキーワード。
特にPyCaretは、なかなか面倒なモデル開発の試行錯誤がかなり自動化されますし、機械学習の知識があまりなくても、とりあえずモデル開発できる便利さがあります。
PyCaretはPythonのライブラリとして提供されており、自分で準備した環境(ローカルPC上のPython環境や、研修でも使っているGoogle Colaboratoryなど)で使いますが、Google CloudやAWSといったクラウドAI環境で提供されている機械学習サービスも似たようなモデル開発の自動化が実現しています。
最近は、ChatGPTやStable Diffusionなどの生成系AIで学習済みモデルの活用が一般化しています。また、画像分類系でも一般的な物体の認識であれば、学習済みモデルの活用が可能です。
ただ、独自のデータを使ってモデルを作る作業も引き続き必要です。自社でしか持っていないデータは、学習済みのモデルとして提供されているAIでは原則として活用できません。
また、PyCaretで作成できるような予測系のモデルは、特に独自のデータを使ってモデルを作る必要があります。
PyCaretは、それほど一般的に普及しているツールではないかもしれませんが、独自のモデル開発が必要な分野にもローコード、(クラウドAIでは)ノーコードのツールが出てきているということを知っていただく必要があると思っています。(それが、この研修を組み立てた意図です。)
また、作成したモデルを実際にシステムで使うには、デプロイ作業が必要です。
Google Colaboratoryを実習環境としているので、少し無理筋なところもあるのですが、FlaskでのモデルのAPI化についても取り上げています。
この研修はSEカレッジというSEプラスさんのサービスを契約されている会社でのみ受講可能ですが、SEプラスさんなどで個別研修の実施も可能ですので、ご興味のある方はぜひ!