どうもデータミックス人事の星野です。
今回は今年4月に入社した新卒データサイエンティストが「勉強会を開く」と聞き、オブザーバーとして勉強会に参加しました。
どんな勉強会をしているのかリポートさせて頂きます。
勉強会のお題は「製造業の見積もりの予測」
今回の勉強会は5回にわたり分析の進捗状況や結果を報告会をするという内容です。
第1回目は皆の「分からないを共有し、各自が意見を述べて皆で正解を探し出す。」
そんな流れで真面目に楽しくデータについて話し合いました。
データの中には何を表しているか分からない、「分類表記」や「ワード」が度々出てきます。
仲間と知識を共有し、補うことから勉強会が始まりました。
第2~4回は分析の中間結果を発表。
本記事ではデータサイエンティスト1名の分析事例を取り上げます。
そのデータサイエティストは配管を大きさ別に分類し、配管の大きさと数で相関性がないか分析していました。
まずは被説明変数と変数をきめ、重回帰分析(精度指数である決定係数の算出)を以下の流れで行っておりました。
①POSカテゴリーごとにデータを分割
②VIFを用いた説明変数の選択
③XG boostを用いた説明変数の重要度の序列化
④説明変数の選択
⑤重回帰分析と決定変数の算出
各データサイエティストの考えが違うように、各自がさまざまな視点で分析し、お題についての結論を導き出そうとします。話し合いの中で、他者の考えが答えを解き明かすヒントになることもあります。
皆の意見や知識が混ざり合い、「問い」が解けていく面白さを感じました。
オブザーバーとして参加している私も「どんな結果が出るかワクワクする」そんな会でした。
第5回目は各自結論に迫る会。
最終日には、配管予測にの目安となる大きさの配管を見つけ、見積もりの予測に使用できるという結論に至りました。
今回は製造業の話でしたが、製造業の中でも製造方法や部品の名前一つ一つに知識が必要なこともデータ分析の難しさだと感じました。加えて、多くのデータの中から特徴を読み出すことは、学習知識と分析データの活用を掛け合わせて答えを導き出す価値のあるスキルだと感じました。
振り返り、感想
勉強会に参加し、データサイエンティストの業務内容を深掘りすることができました。
また、入社1年経たずして、勉強会の企画〜運営まで行っている新卒データサイエンティストの姿に感動しました!本当にお疲れ様です!
今回の題材以外でも月に数回データサイエンティスト内での勉強会を実施しているため、今後も気になる勉強会をwatchしていきたいと思います!!
最後まで記事を読んでいただきありがとうございました!