SRE Manager F/H - CDI
Qui sommes-nous ?
Tiime est une start-up française créée en 2015. Chez Tiime, nous développons LA super app pour entreprendre, au service des entrepreneurs et des experts-comptables.
Côté entrepreneur, la super app regroupe un maximum de fonctionnalités pour gérer son entreprise au quotidien : facturation, achats, stockage des documents, compte pro. Le tout en 1 pour simplifier l'entrepreneuriat !
Côté expert-comptable, Tiime propose le meilleur de la technologie en mettant à disposition des outils simples et puissants pour gagner en productivité, booster la croissance et repenser l'expérience client.
Précurseur en matière d'intelligence artificielle, Tiime est un acteur majeur de la digitalisation de la comptabilité et de la gestion financière des entreprises. À travers ses produits, Tiime sert aujourd'hui le quotidien de plus de 300 000 entrepreneurs et 3000 experts-comptables.
Notre ambition ? Accompagner ⅓ des nouveaux créateurs d'entreprise en France et devenir le logiciel comptable leader du marché !
Ça te tente ? Rejoins notre aventure !
Rejoignez une équipe Tech en pleine croissance
Dans un contexte de forte croissance et d'augmentation continue des usages de nos produits, nous renforçons notre équipe Infrastructure & Platform Engineering.
Notre ambition est de construire une plateforme fiable, scalable et sécurisée, permettant aux équipes de développement de se concentrer sur la création de valeur. Pour accompagner cette transformation, nous recherchons un(e) SRE Manager capable de piloter les enjeux de fiabilité, de supervision et d'excellence opérationnelle tout en accompagnant l'équipe dans sa montée en maturité.
Tu travailleras en étroite collaboration avec les équipes Infrastructure, Développement, Produit et SecOps afin de garantir la disponibilité de nos services et d'installer durablement une culture SRE au sein de l'organisation.
💡Ton rôle:
En tant que SRE Manager, tu seras le référent des sujets de fiabilité opérationnelle, d'observabilité et d'amélioration continue de notre plateforme.
Aux côtés du Responsable Infrastructure, tu contribueras à structurer les pratiques SRE, accompagner les équipes techniques et porter les projets liés à la supervision, à l'automatisation et à la continuité de service.
Tu seras également un acteur clé dans la mise en place d'une organisation de supervision 24/7 et dans la coordination des partenaires impliqués dans l'exploitation de notre plateforme.
🚀Tes missions
Fiabilité et Excellence Opérationnelle
Définir et piloter les indicateurs de fiabilité (SLI), les objectifs de service (SLO) et les budgets d'erreur.
Garantir la disponibilité et la résilience des plateformes en production.
Participer à la gestion des incidents majeurs et coordonner les cellules de crise lorsque nécessaire.
Mettre en place et maintenir les runbooks opérationnels afin d'améliorer la réactivité des équipes.
Animer les retours d'expérience et post-mortems dans une démarche d'amélioration continue.
Accompagner les équipes dans l'adoption des bonnes pratiques SRE.
Observabilité et Supervision
Définir et faire évoluer notre stratégie de monitoring et d'alerting.
Structurer les pratiques d'observabilité (logs, métriques, traces).
Développer une supervision proactive permettant d'anticiper les incidents avant leur impact utilisateur.
Piloter la mise en place d'une supervision externalisée 24/7.
Produire les indicateurs de suivi et les reportings liés à la disponibilité des services.
Platform Engineering & Automatisation
Contribuer à l'évolution de notre plateforme cloud basée sur Kubernetes.
Industrialiser les déploiements et le provisioning via l'Infrastructure as Code.
Participer à l'amélioration des services proposés aux équipes de développement (alerting, documentation, self-service, automatisation).
Réduire le "toil" en automatisant les tâches répétitives et en développant des mécanismes d'auto-remédiation.
Management & Coordination
Accompagner la montée en compétences des membres de l'équipe.
Assurer la coordination entre les équipes Infrastructure, Développement, Produit et Sécurité.
Adapter ta communication à des interlocuteurs techniques comme non techniques.
Représenter l'équipe auprès des partenaires internes et externes.
Participer à la structuration des processus, de la documentation et des standards opérationnels.
💻Ce que nous pouvons t'apporter :
Notre stack technique:
Cloud & Infrastructure
AWS (EKS, RDS, IAM, VPC, S3, Redshift, Bedrock)
Kubernetes
Docker
Infrastructure as Code
Terraform
OpenTofu (ou équivalent)
Helm
SOPS
CI/CD
GitHub Actions
Observabilité
Grafana
Data & Middleware
PostgreSQL
Elasticsearch
Valke
🔎 Profil recherché :
Ton expérience
Tu disposes d'au moins 5 ans d'expérience dans des environnements cloud critiques en tant que SRE, DevOps, Platform Engineer ou Infrastructure Engineer.
Tu as déjà participé à la mise en place ou à la structuration de pratiques SRE.
Une expérience dans un environnement SaaS, FinTech ou à forte volumétrie est un véritable atout.
Tes compétences techniques
Tu maîtrises les environnements AWS et les architectures cloud modernes.
Tu possèdes une solide expérience de Kubernetes et des architectures microservices.
Tu es à l'aise avec Terraform ou des solutions équivalentes d'Infrastructure as Code.
Tu maîtrises les sujets de monitoring, alerting, observabilité et gestion d'incidents.
Tu connais les principes SRE : SLI, SLO, Error Budget, MTTD et MTTR.
Tu apprécies l'automatisation et sais développer des scripts ou outils en Python, Go ou équivalent.
Ce qui fera la différence
Une expérience dans la mise en place d'une supervision ou d'une astreinte 24/7.
Une forte sensibilité aux sujets de Platform Engineering et d'expérience développeur.
Une capacité à faire le lien entre enjeux techniques, opérationnels et humains.
Une excellente communication et une capacité à vulgariser des sujets complexes.
L'envie de construire, structurer et faire grandir une organisation technique.
Pourquoi nous rejoindre ?
Pour participer à la construction d'une plateforme moderne et à fort impact.
Pour avoir une réelle influence sur les choix d'architecture, d'observabilité et d'exploitation.
Pour rejoindre une équipe experte, bienveillante et orientée amélioration continue.
Pour contribuer activement à la diffusion de la culture SRE et Platform Engineering au sein de l'entreprise.
FULL REMOTE POSSIBLE