Sep 27, 2009

Celcom: Recovery From Downtime

"Den tak bersalah." John Terry menjawab soalan pasal
tragedi Celcom dan juga tragedi Chelsea. Ha ha ha.

Celcom mengalami outage/downtime selama hampir 24 jam. Disebabkan takde network, aku suspek beberapa orang tak dapat contact aku untuk direction ke rumah aku, dan dapatlah aku tidur nyenyak di siang hari sampai la Apis dapat jumpa rumah aku. Ha ha. Mari cerita pasal Celcom time-time raya ni.

Celcom's Capability
Celcom mempunyai beberapa MVNO yang berkongsi trafik yang sama (RedTone, U Mobile, Tune Talk, etc). Dan paling pelik CEO Celcom declare outage disebabkan pertambahan trafik sehingga 5 kali ganda. Sepatutnya dengan beban trafik dan MVNO yang sedia ada, team teknikal Celcom boleh predict keadaan pada musim perayaan.

Kebiasaannya satu nod cukup untuk menampung trafik harian, dan pertambahan trafik hanya ada backup satu nod? Jadi adakah Celcom, sebagai Service Provider of the year 2009, sedar capability mereka. Mampu ke menanggung pelanggan Celcom dan MVNO? Sejauh mana Celcom sanggup invest untuk memperbaiki aliran trafik komunikasi mereka?

Dalam telekomunikasi GSM, kesan avalanche disebabkan oleh limit spektrum dan frekuensi bukan baru semalam wujud. Masalah ini juga berlaku kat China yang mana pertambahan pengguna handphone yang mendadak, dengan China yang memang ada rakyat jelata yang ramai.


Celcom's Recovery.
Setiap kali downtime, yang paling penting ialah recovery. Time is money. Every second counts. Recovery dalam perkataan yang geek/nerd macam aku guna ialah MTTR atau MeanTime To Repair.

Orang takkan complaint unless downtime berjam-jam lama. Kalau setakat 15-20 minit kita takkan complaint sebab kita semua sedar Celcom memang tak efisyen. Ha ha.

Downtime ialah kehilangan fungsi peralatan atau mesin atau servis. Downtime juga bermaksud loss cost. Dalam kes Celcom (service provider) loss kepada syarikat dan juga pelanggan. Kalau dalam manufacturing industry, every minute of downtime will cost thousands of ringgit dan industri oil and gas, melibatkan jutaan ringgit. Rugi kan? Kalau dalam healthcare, downtime akan melibatkan nyawa.

World class team manage to handle MTTR in less than 8 minutes. Ini sekaligus melayakkan Celcom jatuh ke peringkat MSSM atau MSSD sahaja. Kalau team tu kerja dengan aku, selayaknya mereka kena maki dan ayat standard yang aku bagi ialah "baik kau kerja kat kilang kicap".

Masalah human resource management sepatutnya bukan isu untuk syarikat HEBAT macam Celcom. From top to bottom mesti tersusun. Aku masih ingat lagi sensei aku cakap pasal improvement in working area or kaizen. Before any implementation of kaizen, the Kaikaku must take place first. Kaikaku is the top management improvement or top overhaul.

Kalau lah komen yang aku baca kat sini betul, amatlah menyedihkan sebab team technical adalah core atau tulang belakang kepada syarikat telekomunikasi. Adakah Celcom sedar siapa yang tentukan QOS sebenarnya?

Sepatutnya team technical mesti world class. Barulah dapat service world class. Cutting cost kat team teknikal then hired newbies to take over? Watdehel?

Ini belum lagi masuk cerita method of troubleshooting and how lean the system is. Takde FMEA ke?

Kalau betul limitation dalam team ialah human resource skills, then dalam menuju ke arah wold class, sila ambil 3 perkara basic ini sebelum ke perkara yang lebih kompleks.

(1) Improve service procedure
(2) Improve testing procedure
(3) Improve skills of staff

4 comments:

faiz said...

nasib baik aku pakai telco keling...
takde gangguan

frH said...

org lain smua dok blog psl raya, kau dok blog psl celcom .. tu laa sape suruh pakai celcom. dah dah g tukar ..

Azhan said...

farah,
skrg aku pakai walkie-talkie je

push to talk punya teknologi

ha ha

Wak Zailan said...

dah kontraktor Celcom nya kompeni aku, Person-in-Charge - Chep!!!

memang dah kena laaa tu!!! Sengal laaa.....

baik pakai TM Homeline Wireless jeeee, hahahahahaaaa