10日間でデータサイエンスプロダクトを構築する
Instacartで遅れた配送(遅配)を減らす スタートアップでは、プロダクトをゼロから作成する機会があります。 この記事では、Instacartの私の最初のプロジェクトを例として、貴重なデータサイエ
https://magazine.techcareer.jp/instacart-blog/technology-instacart-blog/361/
スタートアップでは、プロダクトをゼロから作成する機会があります。 この記事では、Instacartの私の最初のプロジェクトを例として、貴重なデータサイエンスプロダクトを迅速に構築する方法を紹介します。
ここに問題があります。 Instacartのショッピングカートに商品を追加した後、顧客はチェックアウト時に配送ウィンドウ(配送の時間)を選択することができます(図1参照)。 その後、Instacartのshoppersは、注文通りに届けようとします。 混雑する時には、当社のシステムでは、処理できる注文数よりも多くの注文を受け入れ、遅れて注文するものもありました。
私たちは、遅れの問題に対処するためにデータサイエンスを活用することに決めました。 この考え方は、データサイエンスモデルを使用して各ウィンドウの配信キャパシティー(delivery capacity)を見積もり、注文数がそのキャパシティーに達するとウィンドウが閉じられるようにすることでした。
ここに10日間でv1製品を構築した方法があります。
図1.顧客は、利用可能な配達ウィンドウを選択することができます。
私たちは、適切なものに取り組み、迅速なソリューションを開発できるように、計画を立てました。
メトリック 1日あたりの遅配のパーセンテージを用いて、遅延を測定しました。私たちは配信ウィンドウをあまりにも早く終了させたくないので、時間通りに配信される可能性のある注文をキャプチャできませんでした。したがって、1日あたりの配信数がカウンタメトリックとして使用されました。 (現在、shoppersの利用度をカウンターメトリックとして使用しています)。
Low-hanging fruit. データは、多くの遅配が前日に注文したことを示しています。 そのため、翌日の配信ウィンドウ(図1:明日のウィンドウ)に重点を置くことにしました。
解決 時間ウィンドウT(TとT + 1との間)内に注文を送るために、shopperはTの前の注文を処理し始めることができます。図2は、shopperがウィンドウT-2の注文に取り組み始め、 大部分の注文は2時間未満で済むので、配送ウィンドウTのキャパシティーは、主に時間ウィンドウT、T-1、およびT-2におけるshoppersの数に依存します。
図2どれくらい注文に費やされたshopperの時間の図。
線形関係を仮定すると、配信ウィンドウTの容量は、以下のように書くことができます。
capacity(T) = a+b0*#shoppers(T)+b1*#shoppers(T-1)+b2*#shoppers(T-2)
キャパシティーにも影響を与える他の要因(天気など)があるかもしれませんが、我々は簡単に始めることに決めました。
我々はフィーチャーエンジニアリング、トレーニングの作成とデータのテスト、および、、、、、
タイトル:Building A Data Science Product in 10 Days
原文URL:https://tech.instacart.com/building-a-data-science-product-in-10-days-d2f4688567b0
トリリンガルのメンバーが翻訳した記事の気になる続きは👇👇👇
他にも『techcareer magazine』では
エンジニアやクリエイターの人生やキャリアのお役立ち情報を配信中!
#slackで活躍している日本人エンジニアのインタビューなど実際に現地へ足を運び取って来た情報も!
ぜひご覧ください!