“ข้างในเป็นยังไงบ้างคะ?” สเตซี่ถามอย่างใจดีพลางเงยหน้าขึ้นจากคีย์บอร์ด

ผมได้แต่ส่ายหน้า “ผมไม่อยากจะเชื่อเลย เขาเพิ่งกล่อมให้ผมรับงานใหม่ที่ผมไม่ต้องการสำเร็จเฉยเลย มันเกิดขึ้นได้ยังไงกันนะ?”

“เขามีวาทศิลป์ในการจูงใจคนเก่งมากค่ะ” เธอตอบ “เท่าที่ฉันรู้นะ เขาเป็นคนที่ไม่เหมือนใครจริงๆ ฉันทำงานกับเขามาเกือบสิบปีแล้ว และฉันพร้อมจะตามเขาไปทุกที่ มีอะไรที่ฉันพอจะช่วยให้งานของคุณง่ายขึ้นไหมคะ?”

ผมนิ่งคิดครู่หนึ่งแล้วถามว่า “มีปัญหาเรื่องระบบจ่ายเงินเดือน (payroll) ด่วนที่ต้องรีบจัดการ ดิก แลนดรี้ (Dick Landry) อยู่ชั้นสามใช่ไหมครับ?”

“นี่ค่ะ” เธอพูดแทรกขึ้นมาก่อนที่ผมจะถามจบ พร้อมยื่นโพสต์อิทที่มีข้อมูลติดต่อของดิกครบถ้วน ทั้งตำแหน่งห้องทำงาน เบอร์โทรศัพท์ และข้อมูลอื่นๆ

ผมยิ้มให้เธอด้วยความซาบซึ้ง “ขอบคุณมากครับ—คุณยอดเยี่ยมที่สุดเลย!”

ผมกดเบอร์มือถือของดิกขณะเดินไปที่ลิฟต์ “ดิกพูดครับ” เขาตอบด้วยน้ำเสียงห้วนๆ และยังมีเสียงพิมพ์ดีดดังแทรกมาจากข้างหลัง

“นี่บิล พาลเมอร์ครับ สตีฟเพิ่งแต่งตั้งผมเป็น VP of IT Operations คนใหม่ และเขาขอให้ผม—”

“ยินดีด้วยนะ” เขาขัดจังหวะ “เอาละ ฟังนะ คนของผมเจอความผิดปกติร้ายแรงในระบบจ่ายเงินเดือน คุณจะมาที่ห้องผมได้เมื่อไหร่?”

“เดี๋ยวนี้เลยครับ” ผมตอบ แล้วก็ได้ยินเสียงตัดสายทันที เป็นการต้อนรับที่ “อบอุ่น” ดีจริงๆ

ที่ชั้นสาม ผมเดินผ่านแผนกการเงินและบัญชีที่เต็มไปด้วยคนใส่เสื้อเชิ้ตลายทางและปกเสื้อที่อัดฉีดอย่างดี ผมเจอติกที่โต๊ะทำงาน เขายังติดสายอยู่กับใครบางคน เมื่อเขาเห็นผม เขาก็เอามือปิดปากโทรศัพท์ “คุณมาจากไอทีใช่ไหม?” เขาถามห้วนๆ

เมื่อผมพยักหน้า เขาพูดใส่โทรศัพท์ว่า “ฟังนะ ผมต้องไปแล้ว คนที่จะมาช่วยในที่สุดก็มาถึงเสียที เดี๋ยวผมโทรกลับ” โดยไม่รอคำตอบ เขาก็ตัดสายทันที

ผมไม่เคยเจอใครที่ตัดสายคนอื่นเป็นกิจวัตรขนาดนี้มาก่อน ผมเลยต้องเตรียมใจรับมือกับการสนทนาที่คงจะสั้นกระชับและไม่มีการมานั่ง “ทำความรู้จักกัน” ให้เสียเวลาแน่นอน

ผมค่อยๆ ยกมือขึ้นชูอีเมลที่พิมพ์ออกมาให้ดิกดูราวกับกำลังอยู่ในสถานการณ์จับตัวประกัน “สตีฟเพิ่งบอกผมเรื่องระบบจ่ายเงินเดือนล่ม ผมควรจะเริ่มทำความเข้าใจสถานการณ์จากตรงไหนดีที่สุดครับ?”

“เรากำลังตกที่นั่งลำบากสุดๆ” ดิกตอบ “ในการรันระบบจ่ายเงินเดือนเมื่อวานนี้ ข้อมูลพนักงานรายชั่วโมงทั้งหมดหายไปเกลี้ยง เราค่อนข้างมั่นใจว่าเป็นปัญหาจากไอที ความผิดพลาดครั้งนี้ทำให้เราจ่ายเงินเดือนพนักงานไม่ได้ ซึ่งมันผิดกฎหมายแรงงานหลายข้อ และแน่นอนว่าสหภาพแรงงานต้องโวยวายบ้านแตกแน่ๆ”

เขาพึมพำกับตัวเองครู่หนึ่ง “ไปหาแอน (Ann) ผู้จัดการฝ่ายปฏิบัติการ (Operations Manager) ของผมกันเถอะ เธอเครียดจนแทบจะทึ้งผมตัวเองอยู่แล้วตั้งแต่เมื่อวานบ่าย”

ผมต้องเดินเร็วเพื่อให้ทันเขา และเกือบจะชนเขาเข้าให้เมื่อเขาหยุดกะทันหันแล้วชะโงกหน้ามองผ่านหน้าต่างห้องประชุม เขาเปิดประตูเข้าไป “ข้างในเป็นยังไงบ้างแอน?”

ในห้องมีผู้หญิงแต่งตัวดีสองคน คนหนึ่งอายุประมาณสี่สิบห้าปี กำลังเพ่งมองไวท์บอร์ดที่เต็มไปด้วยผังงาน (flowcharts) และตารางตัวเลขมากมาย ส่วนอีกคนอายุสามสิบต้นๆ กำลังพิมพ์งานในแล็ปท็อป มีแผ่นสเปรดชีตวางเกลื่อนกลาดอยู่บนโต๊ะประชุมตัวใหญ่ ผู้หญิงที่อายุมากกว่าชี้ปากกาที่เปิดฝาทิ้งไว้ไปที่สิ่งที่ดูเหมือนจะเป็นรายการสาเหตุที่อาจทำให้ระบบล้มเหลว

ท่าทางการแต่งตัวประกอบกับสีหน้าที่ดูเป็นกังวลและหงุดหงิด ทำให้ผมเดาว่าพวกเธอคงถูกดึงตัวมาจากสำนักงานบัญชีแถวนี้แน่ๆ อดีตผู้ตรวจสอบบัญชีสินะ ดีเหมือนกันที่มีพวกเขาอยู่ข้างเรา

แอนส่ายหน้าด้วยความเหนื่อยหน่าย “ยังไม่ค่อยคืบหน้าเท่าไหร่ค่ะ เราเกือบจะมั่นใจแล้วว่านี่คือความล้มเหลวของระบบไอทีในส่วนของระบบบันทึกเวลา (timekeeping) ต้นทาง ข้อมูลพนักงานโรงงานรายชั่วโมงทั้งหมดพังพินาศในการอัปโหลดครั้งล่าสุด—”

ดิกขัดจังหวะเธอ “นี่บิลจากไอที เขาได้รับมอบหมายให้มาแก้ปัญหานี้ หรือไม่ก็ยอมตายคาหน้าที่ละมั้ง ผมว่าสตีฟคงพูดแบบนั้นนะ”

ผมทักทาย “สวัสดีครับทุกคน ผมเพิ่งได้รับแต่งตั้งให้เป็นหัวหน้าคนใหม่ของ IT Operations ช่วยเล่าให้ฟังตั้งแต่ต้นหน่อยได้ไหมครับว่าตอนนี้เรารู้อะไรเกี่ยวกับปัญหาบ้าง?”

แอนเดินไปที่ผังงานบนไวท์บอร์ด “เริ่มจากการไหลของข้อมูลก่อนนะคะ ระบบการเงินของเราจะรับข้อมูลการจ่ายเงินเดือนจากแผนกต่างๆ ด้วยวิธีการที่หลากหลาย เราต้องรวบรวมตัวเลขทั้งหมดทั้งของพนักงานเงินเดือนและพนักงานรายชั่วโมง ซึ่งรวมถึงค่าจ้างและภาษีด้วย ฟังดูเหมือนง่ายนะคะ แต่มันซับซ้อนสุดๆ เพราะแต่ละรัฐมีตารางภาษีและกฎหมายแรงงานที่แตกต่างกันออกไป”

“เพื่อเมคชัวร์ว่าไม่มีอะไรผิดพลาด” เธอพูดต่อ “เราจะตรวจสอบให้แน่ใจว่าตัวเลขสรุปยอดนั้นตรงกับตัวเลขรายละเอียดจากแต่ละแผนก”

ขณะที่ผมรีบจดบันทึก เธอก็พูดต่อ “มันเป็นกระบวนการที่ค่อนข้างเทอะทะและต้องทำมือ (manual) เยอะพอสมควร ส่วนใหญ่ก็ใช้งานได้ดีค่ะ แต่เมื่อวานนี้เราพบว่าข้อมูลบัญชีแยกประเภททั่วไป (general ledger) ของพนักงานฝ่ายผลิตรายชั่วโมงไม่อัปโหลดเข้ามา พนักงานรายชั่วโมงทุกคนมียอดชั่วโมงทำงานและจำนวนเงินที่ต้องจ่ายเป็นศูนย์หมดเลย”

“เราเจอปัญหากับการอัปโหลดส่วนนี้บ่อยมากค่ะ” เธอพูดด้วยความหงุดหงิดอย่างเห็นได้ชัด “จนทางไอทีโปรแกรมมาให้เราใช้ทำรายการแก้ไขด้วยตัวเอง (manual corrections) เพื่อที่เราจะได้ไม่ต้องไปกวนพวกเขาอีก”

ผมหน้าเหยเก ผมไม่ชอบเลยที่คนฝ่ายการเงินมาไล่แก้ข้อมูลเงินเดือนด้วยตัวเองนอกแอปพลิเคชันหลักแบบนี้ เพราะมันเสี่ยงต่อความผิดพลาดและอันตรายมาก ใครบางคนอาจจะก๊อปปี้ข้อมูลนั้นลง USB ไดรฟ์ หรือส่งอีเมลออกไปนอกองค์กร ซึ่งนั่นคือวิธีที่ข้อมูลสำคัญขององค์กรหลุดรั่วออกไป

“คุณบอกว่าตัวเลขของพนักงานเงินเดือนปกติดีทุกอย่างใช่ไหมครับ?” ผมถาม

“ใช่ค่ะ” เธอตอบ

“แต่พนักงานรายชั่วโมงกลับเป็นศูนย์หมดเลย” ผมยืนยันความเข้าใจ

“ใช่ค่ะ” เธอตอบย้ำอีกครั้ง

น่าสนใจ ผมถามต่อ “คุณคิดว่าทำไมครั้งนี้ระบบรันไม่ผ่าน ทั้งที่ก่อนหน้านี้ก็ใช้ได้มาตลอด? เคยเจอปัญหาแบบนี้มาก่อนไหมครับ?”

เธอไถ่ไหล่ “ไม่เคยเกิดเรื่องแบบนี้มาก่อนเลยค่ะ ฉันเองก็นึกไม่ออกว่าอะไรเป็นสาเหตุ เพราะไม่มีการเปลี่ยนระบบครั้งใหญ่ (major change) อะไรที่วางแผนไว้สำหรับรอบการจ่ายเงินครั้งนี้เลย ฉันเฝ้าถามคำถามเดิมๆ มาตลอด แต่จนกว่าจะได้คำตอบจากพวกไอที เราก็คงทำอะไรไม่ได้เลยนอกจากรออยู่เฉยๆ แบบนี้”

“แผนสำรองของเราคืออะไรครับ” ผมถาม “ในกรณีที่สถานการณ์มันแย่มากจนเรากู้ข้อมูลพนักงานรายชั่วโมงกลับมาไม่ทันเวลา?”

“ให้ตายเถอะบิล” ดิกโพล่งขึ้นมา “มันก็อยู่ในอีเมลที่คุณถืออยู่นั่นแหละ เส้นตายสำหรับการโอนเงินอิเล็กทรอนิกส์คือ 5 โมงเย็นวันนี้ ถ้าเราพลาดช่วงเวลานี้ไป เราอาจจะต้องส่งเช็คกระดาษเป็นตั้งๆ ผ่าน FedEx ไปยังแต่ละโรงงานเพื่อให้เขาเอาไปแจกพนักงานเอง!”

ผมขมวดคิ้วกับสถานการณ์ที่เขาว่ามา และคนอื่นๆ ในทีมการเงินก็มีสีหน้าไม่ต่างกัน

“แบบนั้นไม่รอดแน่ค่ะ” แอนพูดพลางเอาปากกาเคาะฟัน “เราจ้างเอาต์ซอร์ซ (outsource) ทำระบบจ่ายเงินเดือนค่ะ ในทุกรอบการจ่ายเงิน เราจะอัปโหลดข้อมูลไปให้พวกเขาประเมินผล ในกรณีที่แย่ที่สุด เราอาจจะต้องดาวน์โหลดข้อมูลการจ่ายเงินของรอบที่แล้วออกมา แก้ไขในสเปรดชีต แล้วอัปโหลดกลับเข้าไปใหม่?”

“แต่ประเด็นคือเราไม่รู้ว่าพนักงานแต่ละคนทำงานไปกี่ชั่วโมง เราเลยไม่รู้ว่าจะต้องจ่ายเงินพวกเขาเท่าไหร่!” เธอพูดต่อ “เราไม่อยากจ่ายเกินให้ใครหรอกนะ แต่ก็น่าจะยังดีกว่าเผลอจ่ายขาดให้พวกเขา”

เห็นได้ชัดว่าแผน B นั้นเต็มไปด้วยปัญหา เราคงต้องเดายอดเงินในเช็คของพนักงาน แถมยังเสี่ยงที่จะจ่ายเงินให้คนที่ลาออกไปแล้ว หรือไม่ยอมจ่ายเงินให้พนักงานที่เพิ่งเข้าใหม่ด้วย

การจะหาข้อมูลที่ฝ่ายการเงินต้องการมาให้ได้ เราอาจจะต้องเขียนรายงานแบบเฉพาะกิจ (custom reports) ขึ้นมา ซึ่งนั่นหมายถึงต้องดึงตัวพวก Developer หรือพวกดูแลฐานข้อมูล (database) เข้ามาช่วย

แต่นั่นก็เหมือนกับการราดน้ำมันลงบนกองไฟ พวก Developer น่ะตัวดีเลย ยิ่งกว่าพวกเน็ตเวิร์กเสียอีก ช่วยหา Developer ที่ไม่ทำระบบพัง (production crash) มาให้ผมดูสักคนสิ แล้วผมจะหาคนที่ยังมีลมหายใจอยู่มาให้ดู หรือที่น่าจะเป็นไปได้มากกว่าคือ พวกเขากำลังลาพักร้อนอยู่นั่นแหละ

ดิกพูดขึ้นว่า “นี่มันทางเลือกที่แย่พอกันทั้งคู่ เราอาจจะเลื่อนการจ่ายเงินเดือนออกไปจนกว่าจะได้ข้อมูลที่ถูกต้อง แต่เราทำแบบนั้นไม่ได้—แค่ช้าไปวันเดียว สหภาพแรงงานก็จะเข้ามายุ่งทันที ดังนั้นจึงเหลือแค่ข้อเสนอของแอนที่จะจ่ายเงินให้พนักงานไปก่อนบ้าง แม้ว่าจะเป็นยอดที่ไม่ถูกต้องก็ตาม เราคงต้องไปไล่ปรับยอดเช็คเงินเดือนของทุกคนในรอบหน้า แต่ปัญหาคือตอนนี้เราจะมีข้อผิดพลาดในการรายงานทางการเงิน (financial reporting error) ที่เราต้องกลับมาตามแก้อีกบานตะไท”

เขาเอามือขยี้ดั้งจมูกและบ่นพึมพำต่อไป “เราจะมีรายการบันทึกบัญชี (journal entries) แปลกๆ เต็มไปหมดในบัญชีแยกประเภททั่วไป (general ledger) ประจวบเหมาะกับตอนที่ผู้ตรวจสอบบัญชี (auditors) กำลังจะเข้ามาตรวจ SOX-404 พอดี ถ้าพวกเขาเห็นเรื่องนี้ล่ะก็ พวกเขาไม่มีวันยอมไปจากที่นี่แน่ๆ”

“โอ๊ย ให้ตายเถอะ ข้อผิดพลาดในการรายงานทางการเงินเนี่ยนะ?” ดิกบ่นอุบ “เราต้องขออนุมัติจากสตีฟ และพวกเราคงต้องรับมือกับพวกออดิเตอร์ที่มาปักหลักอยู่ที่นี่กันจนลูกบวชแน่ๆ ไม่มีใครได้เป็นอันทำการทำงานที่แท้จริงกันอีกพอดี”

SOX-404 เป็นชื่อย่อของกฎหมาย Sarbanes-Oxley Act ปี 2002 ที่สภาคองเกรสประกาศใช้เพื่อตอบโต้ความล้มเหลวทางบัญชีของบริษัทอย่าง Enron, WorldCom และ Tyco ซึ่งหมายความว่า CEO และ CFO ต้องลงลายมือชื่อรับรองด้วยตนเองว่ารายงานทางการเงินของบริษัทนั้นถูกต้องแม่นยำ

ทุกคนต่างถวิลหาอดีตที่พวกเราไม่ต้องเสียเวลาไปกว่าครึ่งวันเพื่อพูดคุยกับพวกออดิเตอร์ และคอยทำตามกฎระเบียบใหม่ๆ ที่ขยันออกมาเหลือเกินในแต่ละวัน

ผมก้มมองบันทึกของตัวเองแล้วมองดูนาฬิกา เวลาใกล้จะหมดลงทุกทีแล้ว

“ดิกครับ จากที่ผมฟังมา ผมแนะนำว่าให้คุณเตรียมแผนสำหรับกรณีที่แย่ที่สุดไว้ก่อน และเราควรบันทึกขั้นตอนของแผน B ให้ละเอียดเพื่อที่จะลงมือทำได้โดยไม่มีปัญหาแทรกซ้อน นอกจากนี้ ผมขอเสนอให้เราตัดสินใจกันตอนบ่าย 3 โมง เพราะเราอาจจะยังกู้คืนระบบและข้อมูลทั้งหมดกลับมาได้ทัน”

เมื่อแอนพยักหน้าเห็นด้วย ดิกก็บอกว่า “โอเค คุณมีเวลาสี่ชั่วโมง”

ผมพูดทิ้งท้าย “มั่นใจได้เลยครับว่าเราเข้าใจถึงความเร่งด่วนของสถานการณ์นี้ดี และผมจะรีบรายงานความคืบหน้าให้ทราบทันทีที่ผมรู้ข้อมูลครับ”

“ขอบคุณค่ะบิล” แอนบอก ส่วนติกยังคงนิ่งเงียบในขณะที่ผมหันหลังเดินออกจากประตูห้องไป

ผมรู้สึกดีขึ้นหลังจากที่ได้เห็นปัญหาจากมุมมองของฝั่งธุรกิจ ตอนนี้ถึงเวลาต้องลงไปเจาะลึกดูว่าอะไรกันแน่ที่ทำไห้กลไกการจ่ายเงินเดือนที่แสนซับซ้อนนี้พังลง

ขณะที่เดินลงบันได ผมหยิบโทรศัพท์ออกมาเช็กอีเมล ความรู้สึกสงบนิ่งและมีสมาธิของผมมลายหายไปทันทีเมื่อพบว่าสตีฟยังไม่ได้ส่งอีเมลประกาศเรื่องการเลื่อนตำแหน่งของผมเลย เวส เดวิส (Wes Davis) และ แพตตี้ แมคคี (Patty McKee) ซึ่งเป็นเพื่อนร่วมระดับกับผมมาจนถึงวันนี้ ยังไม่รู้เลยว่าตอนนี้ผมกลายเป็นเจ้านายคนใหม่ของพวกเขาไปแล้ว

ขอบพระคุณมากครับสตีฟ

เมื่อผมเดินเข้าตึก 7 ความรู้สึกเดิมๆ ก็แล่นเข้ามา ตึกของเรานี่มันคือ “สลัม” ของแคมปัส Parts Unlimited ชัดๆ

มันถูกสร้างขึ้นในยุค 1950 และรีโนเวตครั้งล่าสุดตอนยุค 1970 เห็นได้ชัดว่าสร้างมาเพื่อเน้นการใช้งาน ไม่ใช่ความสวยงาม ตึก 7 เคยเป็นโรงงานผลิตผ้าเบรกขนาดใหญ่ของเรา ก่อนจะถูกดัดแปลงให้เป็นดาต้าเซ็นเตอร์ (data center) และพื้นที่ออฟฟิศ สภาพมันดูเก่าและทรุดโทรมมาก

รปภ. ทักทายอย่างร่าเริง “สวัสดีครับคุณพาลเมอร์ เช้านี้เป็นยังไงบ้างครับ?”

แวบหนึ่งผมเกือบจะขอให้เขาช่วยอวยพรให้ผมโชคดีที เพื่อที่สัปดาห์นี้เขาจะได้รับเงินเดือนในยอดที่ถูกต้อง แต่แน่นอนว่าผมทำเพียงแค่ทักทายตอบกลับไปอย่างเป็นกันเองเท่านั้น

ผมมุ่งหน้าไปยังศูนย์ปฏิบัติการเครือข่าย หรือที่พวกเราเรียกกันว่า NOC ซึ่งน่าจะเป็นที่ที่เวสและแพตตี้อยู่ ตอนนี้พวกเขาคือสองผู้จัดการหลักภายใต้การดูแลของผม

เวสคือ Director of Distributed Technology Operations เขารับผิดชอบทางเทคนิคดูแล Windows server กว่าพันเครื่อง รวมถึงทีมฐานข้อมูลและทีมเครือข่ายด้วย ส่วนแพตตี้คือ Director of IT Service Support เธอคุมทีม Help Desk เลเวล 1 และ 2 ทั้งหมดที่คอยรับโทรศัพท์ตลอด 24 ชั่วโมงเพื่อจัดการปัญหาทางเทคนิคและคำขอความช่วยเหลือต่างๆ จากฝั่งธุรกิจ นอกจากนี้เธอยังเป็นเจ้าของกระบวนการและเครื่องมือหลักที่องค์กร IT Operations ทั้งหมดต้องพึ่งพา เช่น ระบบจัดการใบแจ้งปัญหา (ticketing system), ระบบมอนิเตอร์ และการจัดประชุมบริหารจัดการการเปลี่ยนแปลง (change management meetings)

ผมเดินผ่านคอกทำงาน (cubicles) ที่วางเรียงรายกันเป็นแถวๆ เหมือนกับตึกอื่นๆ แต่สิ่งที่ไม่เหมือนตึก 2 และตึก 5 ก็คือผมเห็นสีที่หลุดลอกและรอยคราบคล้ำที่ซึมออกมาจากพรม

ส่วนนี้ของตึกถูกสร้างทับพื้นที่ที่เคยเป็นไลน์ประกอบหลักของโรงงาน ตอนที่พวกเขาดัดแปลงพื้นที่นี้ พวกเขาไม่สามารถล้างน้ำมันเครื่องออกไปได้หมด ไม่ว่าเราจะลงสารเคลือบพื้นไว้หนาแค่ไหน น้ำมันก็ยังหาทางซึมผ่านพรมออกมาจนได้

ผมโน้ตไว้ว่าจะยื่นของบประมาณเพื่อเปลี่ยนพรมและทาสีผนังใหม่ ตอนที่อยู่นาวิกโยธิน การดูแลโรงนอนให้สะอาดและเป็นระเบียบไม่ใช่แค่เพื่อความสวยงามเท่านั้น แต่เพื่อความปลอดภัยด้วย

นิสัยเก่าๆ นี่มันเลิกยากจริงๆ

ผมได้ยินเสียงจากห้อง NOC มาแต่ไกลก่อนจะเดินไปถึงเสียอีก มันเป็นพื้นที่โล่งขนาดใหญ่ที่มีโต๊ะยาววางเรียงรายอยู่ตามผนังฝั่งหนึ่ง พร้อมจอมอนิเตอร์ขนาดใหญ่ที่แสดงสถานะของบริการไอทีต่างๆ เจ้าหน้าที่ Help Desk เลเวล 1 และ 2 นั่งประจำการอยู่ตามแถวเวิร์กสเตชันทั้งสามแถว

มันก็ไม่ได้ดูเหมือนศูนย์ควบคุมภารกิจในหนังเรื่อง Apollo 13 เป๊ะๆ หรอกนะ แต่ผมก็มักจะอธิบายให้ญาติๆ ฟังแบบนั้นแหละ

เวลาที่เกิดปัญหาใหญ่ขึ้นมา คุณต้องให้ผู้ที่มีส่วนเกี่ยวข้องและผู้จัดการฝ่ายเทคนิคทุกคนมาสื่อสารและประสานงานกันจนกว่าปัญหาจะได้รับการแก้ไข เหมือนอย่างในตอนนี้ ที่โต๊ะประชุมมีคนประมาณ 15 คนกำลังถกเถียงกันอย่างเผ็ดร้อนและเสียงดัง โดยรุมล้อมอยู่รอบโทรศัพท์สปีกเกอร์โฟนสีเทารุ่นคลาสสิกที่ดูเหมือนจานบิน UFO

เวสและแพตตี้นั่งอยู่ข้างกันที่โต๊ะประชุม ผมเลยเดินไปยืนข้างหลังพวกเขาเพื่อแอบฟัง เวสเอนหลังพิงเก้าอี้และกอดอกทับพุงตัวเอง ซึ่งแขนเขาก็กอดไม่รอบพุงหรอก ด้วยความสูง 6 ฟุต 3 นิ้วและน้ำหนักตัวกว่า 250 ปอนด์ เขาเลยดูตัวใหญ่ข่มคนเกือบทุกคน เขาดูเหมือนจะขยับตัวอยู่ตลอดเวลาและมีชื่อเสียงเรื่องการพูดทุกอย่างที่อยู่ในหัวออกมาตรงๆ

ส่วนแพตตี้นั้นตรงกันข้ามกับเขาอย่างสิ้นเชิง ในขณะที่เวสเป็นคนเสียงดัง พูดโพล่ง และตัดสินใจแบบใช้สัญชาตญาณ แพตตี้กลับเป็นคนรอบคอบ ช่างวิเคราะห์ และยึดมั่นในกระบวนการและขั้นตอนอย่างเคร่งครัด ในขณะที่เวสตัวใหญ่ ชอบปะทะ และบางครั้งก็ขี้โมโห แพตตี้กลับดูตัวเล็ก มีเหตุมีผล และเยือกเย็น เธอมีชื่อเสียงเรื่องการรักกระบวนการมากกว่าตัวบุคคล และมักจะตกอยู่ในสถานการณ์ที่ต้องพยายามจัดระเบียบให้กับความวุ่นวายในไอทีอยู่เสมอ

เธอคือหน้าตาขององค์กรไอทีทั้งหมด เมื่อมีอะไรผิดพลาดในไอที คนจะโทรหาแพตตี้ เธอคือนักขอโทษมืออาชีพของเรา ไม่ว่าจะเป็นเรื่องระบบล่ม หน้าเว็บโหลดช้าเกินไป หรืออย่างในกรณีวันนี้ คือข้อมูลหายหรือข้อมูลพัง

คนยังโทรหาแพตตี้เวลาที่พวกเขาต้องการให้งานสำเร็จ—เช่น อัปเกรดคอมพิวเตอร์ เปลี่ยนเบอร์โทรศัพท์ หรือติดตั้ง (deploy) แอปพลิเคชันใหม่ เธอเป็นคนจัดการตารางเวลาทั้งหมด ดังนั้นคนจึงมักจะมาล็อบบี้เธอเพื่อให้งานของตัวเองเสร็จก่อน จากนั้นเธอก็จะส่งต่องานไปให้คนที่ลงมือทำจริงๆ ซึ่งส่วนใหญ่แล้วก็คือคนในกลุ่มเก่าของผมหรือไม่ก็กลุ่มของเวสนั่นเอง

เวสทุบโต๊ะแล้วพูดว่า “ต่อสายหาเวนเดอร์ (vendor) เดี๋ยวนี้เลย แล้วบอกพวกเขาว่าถ้าไม่ส่งช่างเทคนิคมาที่นี่ทันที เราจะย้ายไปใช้บริการคู่แข่งแทน เราเป็นหนึ่งในลูกค้ารายใหญ่ที่สุดของเขานะ! จะว่าไป เราน่าจะเลิกใช้ไอ้ขยะกองนี้ไปตั้งนานแล้วด้วยซ้ำ”

เขามองไปรอบๆ แล้วพูดติดตลก “คุณรู้จักคำพังเพยนั้นใช่ไหม? วิธีที่คุณจะรู้ว่าพวกเวนเดอร์กำลังโกหกอยู่ก็คือตอนที่พวกเขาเริ่มขยับปากนั่นแหละ”

วิศวกรคนหนึ่งที่นั่งตรงข้ามเวสบอกว่า “เรากำลังคุยสายกับพวกเขาอยู่ครับ เขาบอกว่าต้องรออย่างน้อยอีกสี่ชั่วโมงกว่าที่วิศวกรภาคสนามสำหรับ SAN จะมาถึงที่นี่”

ผมขมวดคิ้ว ทำไมพวกเขาถึงพูดเรื่อง SAN กันล่ะ? Storage Area Network หรือ SAN ทำหน้าที่เป็นที่เก็บข้อมูลส่วนกลางให้กับระบบที่สำคัญที่สุดหลายๆ ระบบของเรา ดังนั้นความล้มเหลวของมันมักจะส่งผลกระทบในวงกว้าง (global) ไม่ใช่แค่เซิร์ฟเวอร์ตัวเดียวที่ล่ม แต่มันหมายถึงเซิร์ฟเวอร์เป็นร้อยๆ ตัวจะล่มไปพร้อมๆ กัน

ในขณะที่เวสเริ่มเถียงกับวิศวกร ผมก็พยายามใช้ความคิด ปัญหาการรันระบบจ่ายเงินเดือนล้มเหลวนี้ดูไม่มีเค้าลางว่าเป็นปัญหาจาก SAN เลย แอนเพิ่งบอกว่ามันน่าจะเป็นปัญหาในแอปพลิเคชันบันทึกเวลาของแต่ละโรงงานมากกว่า

“แต่หลังจากที่เราพยายามย้อนกลับ (rollback) ค่าใน SAN มันก็หยุดส่งข้อมูลไปเลยครับ” วิศวกรอีกคนพูดขึ้น “แล้วหน้าจอก็เริ่มแสดงผลเป็นตัวอักษรคันจิ (Kanji) ทั้งหมดเลย! เออ เราคิดว่ามันคือคันจินะ จะอะไรก็ช่างเถอะ แต่เราอ่านไอ้รูปภาพพวกนั้นไม่ออกเลยสักนิด นั่นแหละครับคือตอนที่เราแตระหนักได้ว่าต้องเรียกเวนเดอร์เข้ามาช่วยแล้ว”

แม้ว่าผมจะเพิ่งเข้ามาสังเกตการณ์ทีหลัง แต่ผมก็มั่นใจว่าพวกเรากำลังมาผิดทางอย่างแรง

ผมโน้มตัวลงไปกระซิบกับเวสและแพตตี้ “ขอเวลาคุยกับพวกคุณเป็นการส่วนตัวสักครู่ได้ไหมครับ?”

เวสหันมาโดยที่สายตายังไม่ได้โฟกัสที่ผมเต็มที่ แล้วพูดเสียงดังว่า “รอเดี๋ยวไม่ได้เหรอ? ถ้าคุณยังไม่สังเกตนะ ตอนนี้เรากำลังเจอปัญหาใหญ่โตอยู่”

ผมวางมือลงบนไหล่ของเขาอย่างหนักแน่น “เวส เรื่องนี้สำคัญจริงๆ มันเกี่ยวกับระบบจ่ายเงินเดือนล่ม และเกี่ยวข้องกับที่ผมเพิ่งคุยกับ สตีฟ มาสเตอร์ส และ ดิก แลนดรี้ มา”

เขาดูประหลาดใจ ส่วนแพตตี้ลุกออกจากเก้าอี้เรียบร้อยแล้ว “ไปคุยที่ห้องฉันเถอะค่ะ” เธอพูดพลางเดินนำทางไป

ผมเดินตามแพตตี้เข้าไปในห้องทำงาน และเห็นรูปถ่ายลูกสาวของเธอติดอยู่ที่ผนัง ผมเดาว่าน่าจะอายุประมาณ 11 ขวบ ผมทึ่งมากที่เด็กคนนี้หน้าตาเหมือนแพตตี้เปี๊ยบ—ดูไม่เกรงกลัวใคร ฉลาดหลักแหลม และดูเก่งกาจ—ในแบบที่แอนน่าเกรงขามเล็กน้อยสำหรับเด็กหญิงตัวเล็กๆ ที่น่ารักขนาดนี้

เวสพูดด้วยน้ำเสียงห้วนๆ “เอาละบิล มีอะไรสำคัญขนาดที่ต้องมาขัดจังหวะการแก้ปัญหา Sev 1 (Severity 1) ที่กำลังเกิดขึ้นอยู่แบบนี้?”

นั่นเป็นคำถามที่ดี ปัญหาระดับ Sev 1 คือเหตุการณ์ที่ส่งผลกระทบรุนแรงต่อธุรกิจจนเรามักจะต้องทิ้งทุกอย่างเพื่อมาจัดการแก้ไข ผมสูดลมหายใจลึกๆ “ผมไม่รู้ว่าพวกคุณได้ยินข่าวหรือยัง แต่ลุคและเดมอนไม่ได้อยู่กับบริษัทแล้ว ข้อมูลอย่างเป็นทางการบอกว่าพวกเขาตัดสินใจขอพักผ่อนสักระยะ ส่วนรายละเอียดมากกว่านั้นผมก็ไม่รู้เหมือนกัน”

สีหน้าที่ดูประหลาดใจของทั้งคู่ช่วยยืนยันข้อสงสัยของผม พวกเขายังไม่รู้เรื่องนี้จริงๆ ผมรีบเล่าเหตุการณ์ที่เกิดขึ้นในช่วงเช้าให้ฟัง แพตตี้ส่ายหน้าและส่งเสียง “จึ๊ๆ” ในลำคอด้วยความไม่เห็นด้วย

ส่วนเวสดูโกรธมาก เขาทำงานกับเดมอนมาหลายปี หน้าของเขาเริ่มแดงขึ้น “งั้นตอนนี้เราต้องมารับคำสั่งจากคุณงั้นเหรอ? ฟังนะ ไม่ได้จะว่าอะไรนะเพื่อน แต่คุณไม่ได้มาผิดที่ผิดทางไปหน่อยเหรอ? คุณดูแลระบบ midrange ที่แทบจะกลายเป็นของโบราณมาเป็นปีๆ คุณสร้างงานสบายๆ ให้ตัวเองอยู่ที่นั่น และรู้อะไรไหม? คุณไม่มีไอเดียเลยสักนิดว่าจะรันระบบ distributed ทันสมัยแบบนี้ยังไง—สำหรับคุณ ยุค 1990 ยังเป็นโลกอนาคตอยู่เลยมั้ง!”

“พูดตรงๆ นะ” เขาบอก “ผมว่าหัวคุณคงระเบิดแน่ถ้าต้องมาเจอกับความเร็วและความซับซ้อนที่ผมต้องเผชิญอยู่ทุกวันแบบนี้”

ผมถอนหายใจและนับหนึ่งถึงสามในใจ “คุณอยากจะไปคุยกับสตีฟเรื่องที่อยากได้ตำแหน่งผมแทนไหมล่ะ? เชิญตามสบายเลย แต่ตอนนี้มาทำให้สิ่งที่ธุรกิจต้องการให้เสร็จก่อน และเมคชัวร์ว่าทุกคนจะได้รับเงินเดือนตรงเวลาดีกว่า”

แพตตี้รีบตอบทันที “ฉันรู้ว่าคุณไม่ได้ถามฉันนะคะ แต่ฉันเห็นด้วยว่าปัญหาเรื่องเงินเดือนควรจะเป็นเรื่องที่เราให้ความสำคัญที่สุดในตอนนี้” เธอหยุดไปครู่หนึ่งแล้วพูดต่อ “ฉันว่าสตีฟเลือกได้ดีแล้วล่ะค่ะ ยินดีด้วยนะคะบิล แล้วเราจะคุยเรื่องขอเพิ่มงบประมาณได้เมื่อไหร่คะ?”

ผมส่งยิ้มบางๆ ให้เธอและพยักหน้าขอบคุณ ก่อนจะหันกลับไปมองเวส

เวลาผ่านไปครู่หนึ่ง สีหน้าที่ผมอ่านไม่ออกผุดขึ้นบนหน้าของเขา ในที่สุดเขาก็ยอมโอนอ่อน “เออ ก็ได้ และผมจะทำตามที่คุณเสนอแน่ๆ คือไปคุยกับสตีฟ เขาต้องอธิบายเรื่องนี้ยาวแน่”

ผมพยักหน้า พอนึกถึงประสบการณ์ที่เพิ่งเจอมากับสตีฟ ผมก็ขออวยพรให้เวสโชคดีจริงๆ ถ้าเขาตัดสินใจจะไปท้าดวลกับสตีฟเข้าให้

“ขอบคุณที่สนับสนุนครับผมซาบซึ้งจริงๆ เอาละ ตกลงเรารู้อะไรเกี่ยวกับปัญหาที่เกิดขึ้นบ้าง? หรืออาจจะมีหลายปัญหา? ไอ้เรื่องการอัปเกรด SAN เมื่อวานนี้มันคืออะไร? มันเกี่ยวข้องกันไหม?”

“เรายังไม่รู้” เวสส่ายหน้า “เรากำลังพยายามหาคำตอบอยู่ตอนที่คุณเดินเข้ามานั่นแหละ เมื่อวานนี้เรากำลังอยู่ระหว่างการอัปเกรดเฟิร์มแวร์ (firmware) ของ SAN ตอนที่ระบบรันเงินเดือนล้มเหลว เบรนต์ (Brent) คิดว่า SAN อาจจะทำข้อมูลพัง (corrupting data) เขาเลยเสนอให้เราย้อนกลับการเปลี่ยนแปลง (back out) ซึ่งมันก็ฟังดูสมเหตุสมผลสำหรับผม แต่ก็นั่นแหละ อย่างที่รู้กัน สุดท้ายพวกเขาก็ทำมันกลายเป็นก้อนอิฐ (bricking it) ไปเลย”

จนถึงตอนนี้ ผมเคยได้ยินคำว่า “bricking” (กลายเป็นก้อนอิฐ) เฉพาะกับเรื่องที่มันพังแค่ของเล็กๆ อย่างเวลาอัปเดตมือถือแล้วพังเท่านั้น แต่การเอาคำนี้มาใช้กับอุปกรณ์ราคาหลักล้านดอลลาร์ที่เก็บข้อมูลทั้งหมดของบริษัทที่ประเมินค่าไม่ได้ไว้เนี่ย มันทำให้ผมรู้สึกคลื่นไส้จริงๆ

เบรนต์ทำงานให้เวส เขามักจะอยู่ใจกลางของโปรเจกต์สำคัญๆ ที่ไอทีทำอยู่เสมอ ผมเคยทำงานกับเขามาหลายครั้ง เขาเป็นคนที่ฉลาดมากอย่างไม่ต้องสงสัย แต่ก็น่าเกรงขามเพราะเขารู้เยอะมาก และที่แย่กว่านั้นคือเขามักจะพูดถูกเกือบทุกครั้งเสียด้วยสิ

“คุณก็ได้ยินพวกเขาแล้วนี่” เวสพูดพลางบุ้ยปากไปทางโต๊ะประชุมที่การประชุมแก้ปัญหาล่มยังคงดำเนินต่อไปอย่างไม่ลดละ “SAN ไม่ยอมบูต (boot) ไม่ยอมส่งข้อมูล และคนของเราก็อ่านข้อความแสดงข้อผิดพลาด (error messages) บนหน้าจอไม่ออกเลยสักนิดเพราะมันเป็นภาษาแปลกๆ ตอนนี้ดาต้าเบส (database) หลายตัวล่มไปหมดแล้ว ซึ่งแน่นอนว่ารวมถึงระบบจ่ายเงินเดือนด้วย”

“การจะแก้ปัญหา SAN นี้ เราต้องดึงตัวเบรนต์มาจากงาน Phoenix ที่เราสัญญากับซาร่า (Sarah) ไว้ว่าจะทำให้เสร็จ” แพตตี้พูดด้วยน้ำเสียงเหมือนลางร้าย “งานนี้ต้องมีคนซวยแน่ๆ”

“อ้าว แล้วเราไปสัญญากับเธอไว้ว่ายังไงล่ะ?” ผมถามด้วยความตกใจ

ซาร่าคือ SVP of Retail Operations และเธอก็รายงานตรงต่อสตีฟเช่นกัน เธอมีความสามารถพิเศษที่น่าทึ่งในการโยนความผิดที่ตัวเองก่อให้คนอื่น โดยเฉพาะพวกไอที ตลอดหลายปีที่ผ่านมา เธอสามารถเอาตัวรอดจากการรับผิดชอบที่แท้จริงมาได้ตลอด

แม้ผมจะได้ยินข่าวลือมาว่าสตีฟกำลังปั้นเธอให้เป็นตัวแทนของเขา แต่ผมก็มักจะปัดทิ้งไปเพราะคิดว่าเป็นไปไม่ได้หรอก ผมมั่นใจว่าสตีฟไม่มีทางมองไม่เห็นแผนการของเธอแน่ๆ

“ซาร่าได้ยินใครบางคนพูดว่าเราส่งมอบพวก Virtual Machines ให้คริสล่าช้า” เธอตอบ “เราเลยต้องทิ้งทุกอย่างเพื่อมาลุยเรื่องนี้... จนกระทั่งเราต้องทิ้งทุกอย่างอีกรอบเพื่อมาซ่อม SAN นี่แหละ”

คริส อัลเลอร์ส VP of Application Development รับผิดชอบในการพัฒนาแอปพลิเคชันและโค้ดที่ธุรกิจต้องการ จากนั้นจึงส่งต่อมาให้พวกเราเป็นคนดูแลและบำรุงรักษา (operate and maintain) ชีวิตของคริสในตอนนี้โดน Phoenix ครอบงำไปหมดแล้ว

ผมเกาหัว ในฐานะบริษัท เราลงทุนไปมหาศาลกับเทคโนโลยี Virtualization (การจำลองเสมือน) แม้ว่ามันจะดูคล้ายกับสภาพแวดล้อมการทำงานของเครื่องเมนเฟรม (mainframe) ในยุค 1960 อย่างน่าประหลาด แต่มันก็ได้เปลี่ยนโลกของเวสไปอย่างสิ้นเชิง ทันใดนั้น คุณไม่ต้องบริหารจัดการฟิสิคัลเซิร์ฟเวอร์ (physical servers) เป็นพันๆ เครื่องอีกต่อไป พวกมันกลายเป็นเพียง logical instances ที่อยู่ในเซิร์ฟเวอร์ยักษ์ตัวเดียว หรืออาจจะไปอยู่ที่ไหนสักแห่งบนคลาวด์ (cloud) ด้วยซ้ำ

การสร้างเซิร์ฟเวอร์ใหม่ในตอนนี้ทำได้แค่คลิกขวาในแอปพลิเคชัน การเดินสายเคเบิลน่ะเหรอ? ตอนนี้มันกลายเป็นการตั้งค่าคอนฟิก (configuration setting) ไปแล้ว แต่ถึงแม้จะมีคำมั่นสัญญาว่า Virtualization จะเข้ามาแก้ปัญหาทุกอย่างให้เรา แต่สุดท้ายเราก็ยังส่งมอบ Virtual Machine ให้คริสช้าอยู่ดี

“ถ้าเราต้องให้เบรนต์แก้ปัญหา SAN ต่อ ก็ให้เขาทำไป เดี๋ยวผมจะจัดการซาร่าเอง” ผมบอก “แต่ถ้าปัญหาเรื่องเงินเดือนมันเกิดจาก SAN ทำไมเราถึงไม่เห็นระบบอื่นล่มหรือพังเป็นวงกว้างกว่านี้ล่ะ?”

“ซาร่าคงจะไม่แฮปปี้อย่างแรงแน่ๆ รู้อะไรไหม อยู่ดีๆ ผมก็ไม่อยากได้ตำแหน่งคุณแล้วล่ะ” เวสหัวเราะเสียงดัง “อย่าเพิ่งโดนไล่ออกตั้งแต่วันแรกนะ ไม่งั้นคิวต่อไปคงเป็นผมแน่ๆ!”

เวสหยุดคิดครู่หนึ่ง “จะว่าไปคุณก็พูดมีประเด็นเรื่อง SAN นะ ตอนนี้เบรนต์กำลังจัดการอยู่ ไปที่โต๊ะเขาแล้วดูซิว่าเขาคิดยังไงกันดีกว่า”

ผมและแพตตี้พยักหน้าเห็นด้วย มันเป็นความคิดที่ดี เราจำเป็นต้องสร้างลำดับเวลา (timeline) ของเหตุการณ์ที่เกี่ยวข้องให้ถูกต้องแม่นยำ เพราะเท่าที่ผ่านมา เราตัดสินทุกอย่างจากคำบอกเล่าล้วนๆ

วิธีนั้นมันใช้ไม่ได้กับการคลี่คลายคดีอาชญากรรม และมันก็ใช้ไม่ได้กับการแก้ปัญหาระบบล่มเช่นกัน