The post has been translated automatically. Original language: Russian
We read an interesting case from our colleagues on Habré. In the article, PM Ira Belitsa and engineering manager Svyatoslav Sychev described how the Mindbox team dealt with overloaded technical debt using proper prioritization.
Context: The Mindbox team is working on a highly loaded mailing list product: more than 850 clients generate over 20,000 RPS. In this regard, dozens of tasks regularly "fall" on developers to add new features and fix bugs.
The problem: due to the high load and lack of resources, the team has prioritized work on reliability and maintaining the service level (in Mindbox, this area is called Toil). Because of this, a queue of unrealized client tasks has accumulated.
Solution: Reorganizing the backlog using the RICE-based framework. Each task was evaluated according to the following parameters:
• Impact — the impact of the problem on the team and/or the client (for example, loss of money);
• Frequency — frequency of problem recurrence;
• Blast radius — how many customers are affected, how massive is the problem;
• Estimate — a rough estimate of the time frame.
And then we consider the priority according to the formula (in the attached picture). To keep it up-to-date, we are also introducing two weekly syncs between leads.
The result: the number of completed client tasks increased almost twofold, and for the first time in six months, the volume decreased to comfortable values.
Прочитали интересный кейс от наших коллег на Хабре. В статье PM Ира Белица и engineering manager Святослав Сычев рассказали, как команда Mindbox разобралась с перегруженным техдолгом с помощью правильной приоритизации.
📌 Контекст: команда Mindbox работает над высоконагруженным продуктом рассылок: более 850 клиентов генерируют свыше 20 тысяч RPS. В связи с чем, на разработчиков регулярно «падают» десятки задач по добавлению новых фич и исправлению багов.
📌 Проблема: из-за высокой нагрузки и недостатка ресурсов команда поставила в приоритет работу над надежностью и удержания уровня сервиса (в Mindbox эту ЗО называют Тойл). Из-за этого скопилась очередь из нереализованных клиентских-задач.
📌 Решение: Реорганизация бэклога с помощью фреймворка на базе RIСE. Каждой задаче дали оценку по следующим параметрам:
• Impact — влияние проблемы на команду и/или клиента (например, потеря денег);
• Frequency — частота повторения проблемы;
• Blast radius — сколько клиентов затронуто, насколько массовая проблема;
• Estimate — примерная оценка сроков.
На а дальше — считаем приоритетность по формуле (в прикрепленной картинке). Для поддержания актуальности также вводим два еженедельных синка между лидами.
📌 Результат: число выполненных клиентских задач выросло почти в 2 раза, а тойл впервые за полгода снизился до комфортных значений.