Avsnitt
-
Tenhle díl je o učení se z vlastních a i cizích chyb. Slova jako Postmortem, Root Cause analýza nebo CAPA proces si přidáme do slovníku a zvládneme tak tu nejtěžší část incidentu s grácií.
https://www.jeli.io/incident-analysis https://www.prskavec.net/courses/how-to-make-oncall/chapter12/ https://www.thevoid.community/database https://fiberplane.com/usecases-incident-resolution https://www.fda.gov/inspections-compliance-enforcement-and-criminal-investigations/inspection-guides/corrective-and-preventive-actions-capa -
Vítejte u poslechu podcastu “You Build It You Run It”. Podcast o všem co potřebujete vědět když chcete provozovat globální internetovou službu. Dnešní díl je speciální, protože kromě mě, Vildy, a Láďi, na které jste zvyklí se k nám přidá host. Tím je náš kamarád Lukáš Linhart neboli Almad. Almad byl prvním zaměstnancem Apiary, zastával tam funkci CTO a hlavně nás najal. Má zkušenosti s vývojem, vedením projektů i se zodpovědností za produkt jako takový a hodně se zabývá produktivitou týmů. Právě s Almadem se budeme bavit o SCRUMu.
Agile manifesto - https://agilemanifesto.org/
Scrum - https://www.scrum.org/resources/what-scrum-module
ShapeUp - https://basecamp.com/shapeup
Lukas Linhart - https://almad.blog/essays/ https://www.comicagile.net/comic/how-to-become-an-agile-coach-2/ -
Saknas det avsnitt?
-
Záznam z panelové diskuze na Pycon CZ 2023 (anglicky) Video záznam - https://www.youtube.com/watch?v=xFn0sARWvHU
Mluvime s Naďou Jašíkovou, která je SRE veteránka z OCI a Karlem Minaříkem, který strávil skoro 10 let v Elasticu.
-
Dnešní díl bude hlavně o tom jak dobře a rychle dostaneme změny do produkce. Jak poznáte, že to děláte dobře a co měřit aby to tak zůstalo. Neboli když neměříš tak nevíš a neřešíš.
Dora community DevOps Report v PDF
Google Cloud How implement DORA metrics Kniha Accelerate Project Keptn na měření DORA metrics v K8S PagerDuty a DORA Metrics LinearB a DORA MetricsTřetí živá panelová diskuze, tentokráte bude v rámci Pyconu který se koná 15.-16. září v Praze. Budeme mluvit s Naďou Jašíkovou, která je SRE veteránka z OCI a Karlem Minaříkem, který strávil skoro 10 let v Elasticu.
-
V dnešním díle budeme pokračovat v incidentech z minulého dílu. V tomto díle se zaměříme na to co nedělat.
Incident Antipatterns
https://response.pagerduty.com/resources/anti_patterns/Training provided by PD
https://university.pagerduty.com/page/instructor-led-training -
V dnešním díle se budeme zabývat tím černým scénářem kdy služba nefunguje jak má nebo něco jiného je špatně. Co s tim jak to vyřešit rychle čistě a bez krve? O tom, že štěstí přeje připraveným a že ta hlavní otázka není jestli se to rozbije, ale kdy a co budeme dělat pak.
Hope is not Strategy - https://sre.google/sre-book/introduction/
PagerDuty Incident Response - https://response.pagerduty.com/
Executive Swoop and Poop - https://response.pagerduty.com/training/courses/incident_response/#do-you-wish-to-take-command
Nezapoměňte nás sledovat na Mastodonu - https://mastodonczech.cz/@ybyr
-
Z You build it you run it se dneska budeme i nadále bavit o té Run It části a hlavně o tom jak poznáte, že děláte on-call dobře, udržitelně a že plní účel. Taky se podíváme na to, jaké nástroje vám mohou pomoci a bez kterých se fakt neobejdete.
Metriky k On-Callu - https://www.prskavec.net/courses/how-to-make-oncall/chapter06/ Videa z konference Learning from Incident (LFI) - https://www.youtube.com/playlist?list=PLQmwzq_GIU-idCnJNR4t_aKb0HDCOXfZ1 Nezapoměňte nás sledovat na Mastodonu - https://mastodonczech.cz/@ybyr -
You build it you run it znamená, že někdo se stará, aby služba běžela dobře 24x7x365. To znamená, že někdo je připravený zasáhnout v neděli ve 4 ráno. O tom jak zavést takový režim, co to obnáší a jak si to zorganizovat se budeme bavit v tomhle díle.
Pager - https://cs.wikipedia.org/wiki/PagerPagerDuty - https://www.pagerduty.com/Roundtable na WebExpu - https://webexpo.net/sessions/roundtable-discussion-you-build-it-you-run-itWebexpo 2023 - 20% sleva na vstupenky s kódem "LadaPrskavec"How to design On-Call: https://www.prskavec.net/courses/how-to-make-oncall
-
Jak se vývoj posunul za posledních 30 let od software pro hardware až po vývoj pro webové služby.
Fred Brooks - The Mythical Man-Month: Essays on Software Engineering (1975) - https://en.wikipedia.org/wiki/The_Mythical_Man-Month Není to usenix, ale i tak je to dobré čtení: Landings over Launches - https://blog.devgenius.io/landings-over-launches-how-google-thinks-about-successful-products-f8b32d0536ee Agile Manifesto - https://agilemanifesto.org/ Kanban - https://cs.wikipedia.org/wiki/Kanban Scrum - https://www.scrum.org/resources/what-is-scrum ShapeUp - https://basecamp.com/shapeup Platform Engineering - https://platformengineering.org/blog/what-is-platform-engineeringNěco na závěr
Sledovat nás můžete na Mastodonu, podcast má adresu https://fosstodon.org/@ybyr Na našem webu https://ybyr.net/ potom najdete jak nás kontaktovat a taky něco o nás. -
19. ledna 2023 jsme pořádali panelovou diskusi v Ataccamě. Díky všem, kdo jste dorazili. Hosty byli Roman Pichlík z Ataccamy, Jirka Brunclík z Product Boardu, Borek Bernard z Shoptetu a samozřejmě taky Vilda s Láďou. Pro ty z vás, kdo tam nemohl být v téhle epizodě shrnujeme to, co tam zaznělo.
https://fosstodon.org/@ybyr - náš Mastodon účet pokud nás chcete sledovat a dát nám zpětnou vazbu https://www.meetup.com/prague-golang-meetup/events/291042846/ - Go meetup 21.2.2023, kde budeme oba přednášet https://youtu.be/GJfgotCGPxI - Záznam z panelové diskuze v Ataccamě (Zoom recording) -
Vítejte u poslechu podcastu “You Build It You Run It”. Podcast o všem co potřebujete vědět když chcete provozovat globální internetovou službu. Tématem vás provázejí Láďa a Vilda.
V první epizodě představíme heslo “You build it, you run it” a proč si myslíme, že je to užitečný pohled na provozování služeb. A samozřejmě se také představíme.
Registrace na event 19.1.2023 - https://www.eventbrite.ca/e/you-build-it-you-run-it-the-right-way-to-run-distributed-systems-tickets-500605463417