ระหว่างทางที่ผมขับรถไปทำงาน ผมต้องเปิดระบบอุ่นเบาะก่อนเวลาที่เคยทำปกติเป็นเดือนๆ

ผมหวังว่าหน้าหนาวปีนี้จะไม่แย่เท่าปีที่แล้ว ญาติๆ ของ Paige ซึ่งเป็นกลุ่มคนที่ขี้ระแวงที่สุดที่ผมเคยเจอมา เริ่มสงสัยกันแล้วว่า ปัญหาสภาพภูมิอากาศเปลี่ยนแปลง (global climate change) อาจจะเป็นเรื่องจริงขึ้นมาก็ได้

เมื่อถึงออฟฟิศ ผมหยิบ laptop ออกจากกระเป๋าแล้วยิ้มให้กับความเร็วตอนเปิดเครื่อง ขณะที่ผมเขียนรายงานส่งให้ Steve เกี่ยวกับความคืบหน้าในช่วงหกสัปดาห์ที่ผ่านมา ผมไม่ได้เขียนอะไรเกี่ยวกับ laptop เครื่องใหม่ลงไปเลย ถึงแม้ลึกๆ จะอยากเขียนก็ตาม

สำหรับผม laptop เครื่องนี้เป็นตัวแทนของทุกอย่างที่ทีมของผมได้ทำสำเร็จร่วมกัน ผมภูมิใจในตัวพวกเขามาก ชีวิตตอนนี้รู้สึกเปลี่ยนไปมาก จำนวนเหตุการณ์ Sev 1 outage ในเดือนนี้ลดลงมากกว่าสองในสาม และเวลาในการกู้คืน Incident (Recovery time) ก็ลดลงด้วย น่าจะลดลงไปมากกว่าครึ่งหนึ่งเลยทีเดียว

ข้อมูลเชิงลึกที่เราได้รับจากการประชุมที่แปลกประหลาดครั้งแรกกับ Dick และ John บอกผมว่า เรามาถูกทางแล้วในการทำความเข้าใจว่าเราจะช่วยให้ธุรกิจประสบความสำเร็จได้อย่างไร

พอเปิด e-mail ผมก็เห็นโน้ตจาก Kirsten ผู้จัดการโครงการของเธอทุกคนต่างพูดเป็นเสียงเดียวกันว่าโครงการต่างๆ Flow ได้เร็วขึ้นมาก จำนวน Task ที่รอให้ Brent และทีม IT Operations คนอื่นๆ ทำนั้นลดลงไปเยอะมาก จริงๆ แล้วถ้าผมอ่านรายงานไม่ผิด Brent แทบจะสะสางงานได้ทันทั้งหมดแล้ว

ในด้านการทำโครงการ เราอยู่ในสถานะที่ดีเยี่ยม โดยเฉพาะอย่างยิ่งกับโครงการ Phoenix

มีการ Deploy โครงการ Phoenix อีกครั้งในวันศุกร์นี้ มันเป็นการแก้ไข Defect เท่านั้น ไม่มีการเพิ่มหรือเปลี่ยน Function หลักๆ ดังนั้นมันควรจะราบรื่นกว่าครั้งก่อน เราส่งมอบงานได้ตรงตามกำหนดเวลาทั้งหมด แต่เหมือนเคย ยังมีรายละเอียดอีกเป็นล้านอย่างที่ต้องจัดการให้เรียบร้อย

ผมรู้สึกขอบคุณที่ทีมของผมสามารถโฟกัสกับ Phoenix ได้อย่างเต็มที่ เพราะเราทำระบบ Infrastructure ของเราให้ Stable แล้ว เมื่อเกิด Outage หรือ Incident ที่เลี่ยงไม่ได้ เราก็รับมือได้เหมือนเครื่องจักรที่ได้รับการหยอดน้ำมันมาอย่างดี เรากำลังสร้างองค์ความรู้ (tribal knowledge) ที่ช่วยให้เราแก้ปัญหาได้เร็วกว่าที่เคย และเมื่อเราจำเป็นต้อง Escalate งาน มันก็เป็นไปอย่างมีระบบและระเบียบ

เพราะเราปรับปรุงการทำ Production Monitoring ของทั้ง Infrastructure และ Application อยู่ตลอดเวลา ทำให้เกือบทุกครั้งเรารู้เรื่อง Incident ก่อนที่ทางฝั่งธุรกิจจะรู้เสียอีก

Project Backlog ของเราลดลงไปมาก ส่วนหนึ่งมาจากการกำจัดโครงการที่ไร้สาระออกไปจากคิว และ John ก็ทำตามที่สัญญาไว้ เราได้ตัดโครงการด้าน Security ที่ไม่จำเป็นออกจากแผนการเตรียมตัว Audit และงานแก้ไขออกไป โดยแทนที่ด้วยโครงการเชิงป้องกัน (preventive security) ที่ทั้งทีมของผมร่วมกันช่วยทำ การปรับปรุงกระบวนการ Development และ Deployment ของเราช่วยให้ทั้ง Application และ Production Infrastructure มีความแข็งแกร่งและปลอดภัยมากขึ้นอย่างเป็นระบบ และเราเริ่มมั่นใจว่า Defect เหล่านั้นจะไม่เกิดขึ้นซ้ำอีกในอนาคต

การประชุม Change Management ของเราเป็นไปอย่างราบรื่นและสม่ำเสมอมากกว่าที่เคย นอกจากเราจะเห็นภาพชัดเจน (Visibility) ว่าแต่ละทีมกำลังทำอะไรอยู่ งานของเรายัง Flow ได้ดีมากจริงๆ

คนในทีมรู้ชัดเจนกว่าเดิมว่าพวกเขาควรจะทำงานอะไร พวกเขารู้สึกพึงพอใจที่ได้แก้ปัญหาต่างๆ ผมได้ยินมาว่าทุกคนรู้สึกมีความสุขและมีพลังมากขึ้น เพราะพวกเขาได้ลงมือทำงานของตัวเองจริงๆ เสียที

มันแปลกดีที่ตอนนี้ผมมองเห็นโลกของ IT ได้ชัดเจนขึ้นมาก และมันดูแตกต่างจากเมื่อสองสามเดือนก่อนอย่างสิ้นเชิง

การทดลองของ Patty ในการใช้ Kanban รอบตัว Brent นั้นประสบความสำเร็จ เรายังพบกรณีที่งานตีกลับ (Work going backward) ไปหา Brent เพราะเราไม่เข้าใจหรือไม่ได้ระบุรายละเอียดของ Task หรือผลลัพธ์ให้ชัดเจนพอ ทำให้ Brent ต้องมาเสียเวลาตีความหรือแก้ไขใหม่

ตอนนี้เมื่อเกิดเรื่องแบบนี้ขึ้น เราจะรีบเข้าไปจัดการทันทีเพื่อไม่ให้มันเกิดขึ้นซ้ำอีก

และไม่ใช่แค่เรื่องงานของ Brent เท่านั้นที่เรากำลังปรับปรุง การลดจำนวนโครงการที่กำลังทำอยู่ (projects in flight) ช่วยให้เรามีเลนการทำงานที่ชัดเจน งานจึงไหลจาก Work center หนึ่งไปยังอีกที่หนึ่งได้อย่างรวดเร็วและเสร็จสิ้นในเวลาที่สั้นที่สุดอย่างไม่เคยเป็นมาก่อน

เราแทบจะล้างข้อมูลงานที่ล้าสมัยออกจากระบบ Ticketing ของเราได้ทั้งหมดแล้ว มีกรณีหนึ่งที่เราเจอ Ticket ที่ Wes เคยส่งไว้เมื่อสิบกว่าปีก่อนตอนเขายังเป็นวิศวกรระดับ Junior ซึ่งอ้างถึง Task ของเครื่องที่เลิกใช้งาน (Decommission) ไปนานแล้ว ตอนนี้เรามั่นใจแล้วว่างานทุกอย่างในระบบเป็นงานที่สำคัญจริงๆ และมีความหวังว่าจะทำเสร็จได้จริง

เราไม่ใช่ "Bates Motel ของงาน" (ที่งานเข้ามาแล้วไม่เคยได้ออกไป) อีกต่อไปแล้ว

นอกจากความคาดหมายของทีมงาน เรายังเพิ่มจำนวนโครงการที่เราคิดว่ารับไหวพร้อมๆ กัน (concurrently) ได้เรื่อยๆ เพราะเราเห็นภาพ Flow การทำงานชัดเจนขึ้น และมีการจัดการอย่างระมัดระวังว่างานไหนบ้างที่จะปล่อยไปให้ Brent ทำ เราจึงพบว่าเราสามารถปล่อยโครงการออกมาได้มากขึ้นโดยไม่กระทบต่อข้อตกลงเดิมที่เรามีอยู่

ผมไม่คิดว่า Erik เป็นคนบ้าที่เอาแต่โวยวายอีกแล้ว ถึงเขาจะดูพิลึกคนจริงๆ ก็เถอะ ตอนนี้ผมได้เห็นผลลัพธ์ด้วยตาตัวเองในองค์กรของผมแล้ว ผมจึงรู้ว่างาน IT Operations นั้นคล้ายกับงานในโรงงานมาก Erik ย้ำหลายครั้งว่าการปรับปรุงที่เราทำมาทั้งหมดนี้เป็นเพียงแค่จุดเริ่มต้น (tip of the iceberg) เท่านั้น

Erik บอกว่าเรากำลังเริ่มเชี่ยวชาญใน "วิถีแห่งที่หนึ่ง" (The First Way) คือเรากำลังยับยั้งการส่งต่อ Defect ไปยัง Work center ที่อยู่ถัดไป (downstream), จัดการ Flow ของงาน, กำหนดจังหวะการทำงานตาม Constraint ของเรา และจากผลลัพธ์เรื่องการ Audit และข้อมูลจาก Dick เราจึงเข้าใจได้ดีกว่าเดิมมากว่าอะไรคือสิ่งที่สำคัญและอะไรที่ไม่สำคัญ

ในตอนท้าย ผมเป็นผู้นำในช่วง Retrospective ที่เรามาประเมินการทำงานของตัวเองและหาจุดที่ควรปรับปรุง เมื่อมีคนเสนอว่าเราควรเริ่มเชิญคนจากฝั่ง Development มาร่วมประชุมวิเคราะห์หาสาเหตุตอนเกิด Outage (postmortem root cause analysis) ผมก็ตระหนักได้ว่าตอนนี้เรากำลังก้าวเข้าสู่การทำความเข้าใจ "วิถีแห่งที่สาม" (The Third Way) ของ Erik ด้วยเช่นกัน