◆ポジションについて
当社のSREチームではEmbedded SREモデルを採用しており、「Embedded SRE」と「Platform SRE」が存在します。
〇Embedded SRE
特定のプロダクト(キャリアパーク!、就活会議、みん就など)を担当し、そのプロダクトの障害発生時の初動、インフラやCI/CD改善、信頼性の向上などに責務を持ってもらう役割。
※属人化を避けるため、固定ではなく本人の意思を考慮しローテーションしています。
〇Platform SRE
インフラなど信頼性に関わるプラットフォームを開発提供する役割。Terraform ModuleやReusable Workflowの整備などプロジェクト横断のインフラ設計基盤や共通化など全体最適化を担う。
現在、既存サービスの拡大・新規サービスのリリースにより継続的に運用するサービスが拡大していることから、SREエンジニアの増員が必要な状態となっております
そのため、これまでのご経験とご興味に応じていずれかのSREチームに所属し各アプリケーションにおける信頼性を技術的側面から担保して安定したサービスを提供し、中長期的な取り組みにも力を入れられるようお力添え頂ける方を募集します。
◆業務内容
これまでのご経験やスキルを活かしながら、SREチームのリードをして頂きたいと考えています。
<<具体的業務例>>
〇インフラの構築・運用・最適化
- Kubernetes や ECS 等のコンテナオーケストレーションツールを活用し、スケーラブルで高可用なインフラを構築・運用
- Terraform や OpenTofu を用いたインフラのコード化 (IaC) と自動化
- 自社およびグループサービスの最適化、モニタリング、コスト削減施策の実施
〇各種プロダクトのセキュリティ対応
- インフラ、アプリケーションのセキュリティ向上施策(脆弱性スキャン、自動化されたセキュリティチェックの導入)
- セキュリティインシデントの迅速な検出と対応策の策定
〇アラートシステムやモニタリングシステムの設計と実装
- オブザーバビリティとアラートシステムの構築
- Datadog などを使用した監視・アラート基盤の構築
- アラートの設定とインシデント後のフィードバックを通じた継続的改善
- APMツール(Datadog APM)導入などのオブザーバビリティの向上
〇開発者体験(Developer eXperience)の向上
- CI/CD パイプラインの構築と改善
- 開発環境の改善
◆技術スタック
ソースコード管理:GitHub
言語:Ruby, TypeScript. Go, シェルスクリプト
FW:Ruby on Rails, React, NestJS, Remix
DB:Aurora MySQL, ElastiCache for Redis, Elastic Cloud
コンテナ管理/オーケストレーション:ECS, EKS
マニフェスト管理: Kustomize, Helm
CI/CD:GitHub Actions, ArgoCD, CodeBuild
IaC:Terraform, OpenTofu, SAM
Webサーバー:Nginx, Apache, Puma
クラウド:AWS, Google Cloud, Cloudflare
モニタリング:Datadog, Prometheus, AlertManager, 各種 Expoter
データ分析:BigQuery, Grafana, Redash
コミュニケーションツール:Slack, Google Chat
◆ポートのSREとして働く魅力
【新しいスキルをキャッチアップできる】
当社では大小さまざまなサービスを保有しており、SREチームにおいては10個以上のサービスに触れる機会があります。それぞれのサービスはM&Aによって自社サービスとなったものも多く、構成が異なるため、様々な種類の技術に触れる機会があります。また、内製化していくにあたっての技術選定に関わる機会も多いため、多くのスキルをキャッチアップ出来る環境です。
◆必須要件
以下の経験をお持ちの方
・AWSを使って技術基盤を設計・運用した経験
・Infrastructure as Codeツール(TerraformやAnsibleなど)を用いて技術インフラを運用した経験
・コンテナオーケストレーションを実務で運用した経験(KubernetesやECSなど)
※PlatformSRE志望の方の場合
・スクリプトで運用自動化した経験
※EmbeddedSRE志望の方の場合
・Webアプリケーションの開発経験