■ 本ポジションの採用背景
SREチームは、立ち上がりから2年で、これから信頼性向上のためにやるべきこと・やりたいことを進めていきたいフェーズです。さらには、TROCCO®のプロダクト開発の拡大や新サービスCOMETA®のリリースに伴い、開発チームをサポートし、運用面も念頭に置いた機能開発に関わることも増えてきております。
利用規模・機能の拡大スピードに関わらずユーザーに安心してかつ快適にTROCCO®を利用してもらうために、一緒にサービスの信頼性向上の役割を担っていただける方を募集します。
■業務内容
SREとして、弊社が提供するTROCCO®やCOMETA®の安定基盤を構築し、信頼性を高めるための改善を広く行っていただきます。
・データ転送ジョブの実行スケジュールに対し、Kubernetes のノードをより効率的にスケールさせる機能の開発
・アプリケーション・インフラ監視体制の課題洗い出しと改善
・SLI/SLOの策定・改善とモニタリング
・インフラ利用コストと運用コストの最適化
・バグの調査とバグを早期発見するための取り組み立案
・SOC 2取得に向けたプロダクトセキュリティ対策の計画・実行
・CI/CD パイプライン改善
・利用者からの問い合わせ調査・サポート
(従事すべき業務の変更範囲)
会社の定める業務
■primeNumberでSREとして働く魅力
・グローバル展開していくデータエンジニアリングサービスのインフラを支える経験ができる
・利用者に計算資源を払い出す特殊なアーキテクチャに起因する、難易度の高い技術を扱える
・専任SREチームの立ち上げフェーズのため、チームを1から創る経験ができる
・ビジネスに近い距離でSREとして働く経験ができる
■プロダクト開発本部 組織構成
CTO1名/EM2名/ソフトウェアエンジニア13名/SRE 2名
PdM3名/デザイナー 1名/テクニカルライター1名
■開発環境
・言語
Ruby (Rails), Typescript (React), Java (Embulk)
・インフラ
AWS (EKS, ECS Fargateが中心)
・構成管理
Kustomize, Terraform
・監視
CloudWatch, New Relic, Redash, Rollbar
・CI/CD
CircleCI, GitHub Actions
・コミュニケーション
GitHub, Google Workspace, Slack, Confluence, Miro
・その他
1Password
■必須スキル
下記のすべてを満たす方
・CI/CDパイプラインの構築・運用
・Webアプリケーション運用経験
・AWS, Google Cloudなどのクラウド技術を用いたシステム設計・開発・運用経験
・コンテナ技術、ネットワーク、Linuxに関する基礎知識・運用経験
・Terraform, Ansible, AWS CloudFormationなどを利用したIaCの実践経験
・何らかのOSSやSaaSを用いた監視設計・運用経験
・可用性・耐障害性向上に関する知識・経験
・チーム内外の人を巻き込んで物事やプロジェクトを遂行した経験
■歓迎スキル
・Webアプリケーションの開発・運用経験
・Ruby (Rails) によるアプリケーション開発経験
・Kubernetesクラスタの運用経験
・グローバルに利用されるシステムの運用経験
・大規模障害への対応経験
・SREの基本的な概念 (SLI/SLO, エラーバジェット, ポストモーテムなど) の設定・導入経験
・コンテナ、ネットワーク、Linuxに関する深い知識・経験
・セキュリティドメインに関する知識・経験
・何らかのチームリード・マネジメント経験
■求める人物像
・コードを読むことができ、コーディングにも積極的に取り組む意欲のある方
・コミュニケーションの重要性を理解し、コミュニケーションを怠らない方
・ドキュメント化することの重要性を理解し、情報を残す習慣が身に付いている方
・広い視野と当事者意識を持ち、お節介がやける方
・属人化の削減やトイルの削減(自動化)が好きな方
・特定の技術にこだわり過ぎず、柔軟に取捨選択ができる方
・primeNumberのミッション・バリュー(8 Elements)に共感していただける方
https://primenumber.co.jp/recruit/
【働き方】
・フレックス制度あり<コアタイム11:00~16:00(休憩60分)>
・週中日2日までリモートワーク可
・ビール・水・お菓子が無料
月に一回社内で懇親会があり、部署間のコミュニケーションも活発です!