【募集背景】
ユーザー数のさらなる増加を実現するためのサービス拡大を目指しているが、そのためにはサイトの信頼性を高めるSREの強化が重要なポイントと捉えている。
SREとして、プロアクティブに施策を実施していけるようにチームに新たな方を迎えることで、組織強化を図りたい。
【仕事内容】
急拡大中のココナラ経済圏を牽引するSRE(Site Reliability Engineering)ポジションを任せします。
具体的には「どのようにしたらサービスをより多くの方に、より便利に使ってもらえるか」というユーザー視点に立ち、仮説・実行・検証のサイクルを回しながら、サービスの信頼性を高めて頂きます。
■仕事の詳細
・SLA/SLO/SLIの設定・監視、モニタリング環境の改善
・OS、ミドルウェアなどの継続的アップデート
・障害対応およびボトルネック調査・対応
・AWSなど複数クラウドを使用したシステム環境の運用安定化
・アーキテクチャ改善(マイクロサービス、API Gatewayの導入など)
■使用技術
・言語:Go, Python, JavaScript, Ruby, PHP
・サーバ:AWS VPC, EC2, ECS, RDS, ElastiCache, S3, CloudFront, GCP Compute Engine, Kubernetes Engine
・サーバOS:Ubuntu 18.04, Amazon Linux 2
・データベース:RDS Aurora(MySQL), MySQL5.7, MySQL8
・検索エンジン:Elasticsearch, Cloudsearch
・サーバレス:Lambda, Cloud Functions
・プロビジョニング:Ansible, Docker
・オーケストレーション:Terraform, CloudFormation, Capistrano
・アプリケーションモニタリング:NewRelic, AWS X-Ray
・インフラモニンタリング:CloudWatch, Datadog, Pagerduty, Prometheus、Grafana
・ログ管理:Fluentd
・データ分析:Bigquery, Athena
・CI:CircleCI
・バージョン管理:Git, GitHub
【「目指している状態」の実現に向けて現在抱えている課題】
現在、TM含めて6名体制だが、ココナラ経済圏を支えるためにはSREに関わる知見を持った方を増員する必要があり、現状は不足している。
【仕事の魅力】
・自身の技術をベースに、加速度高く信頼性向上を中心としたSRE施策に携わっていける。
・新技術の調査 / 導入に積極的に関われる。
→マイクロサービス化を進めていたり、分散トレーシングの仕組み作り、カオスエンジニアリング、カナリアリリースなどの技術にも取り組んでいる。
・まだまだSREとしての活動は完全ではない中で、組織の作り込みから携わることができる。また、技術負債解消に積極的に取り組むことができる。
【必須(MUST】
・AWS/GCP/Azureのいずれかでの構築/運用経験
・Infrastructure as Codeでの実装経験
・モニタリングツールを利用した環境構築・または運用経験
【歓迎(WANT)】
・コンテナ環境の運用・構築経験
・サーバーでの構築・運用経験
・Rails、PHP、Go、Python、Java、Node.jsでの開発経験
【求める人物像】
・弊社ビジョンに共感でき、自走ができる方
・圧倒的な当事者意識を持って行動できる方
・ユーザー目線でプロダクト開発に取り組める方
・同僚と議論をしながらアイデアや解決策を練り上げることが好きな方