#งานเสร็จแล้วเล่าได้ ไปทำงานแก้ Config ให้สถาบันการเงินแห่งหนึ่ง

71
ตอนที่ไปรับ Brief ปัญหา ก็ได้รับข้อมูลมาประมาณนี้
 
1. ที่นี่เป็น Office ที่มี Dev เยอะมากๆ อุปกรณ์ส่วนตัวของ Dev เยอะไปหมด มือถือ iPad Notebook นาฬิกา แถมยังมีอุปการณ์ IOT เต็ม Office ไปหมด
Network Engineer คนเก่า ออกแบบ Network เป็น /24 เอาไว้ (แปลว่าเครือข่ายมีให้ใช้ได้ 254 Devices) พอพบว่าไม่พอ ก็เลยขยาย Subnet เป็น /23 (ที่รองรับได้ 512 Devices ) แต่ก็ยังเกิดปัญหา DHCP Server แจก IP ไม่พออยู่ดี
เท่าที่ดูสาเหตุเกิดมาจาก ตัว Core Switch ที่เป็น Cisco SG300-52 เนี่ย มันแจก IP ผ่าน DHCP ได้ก็จริง แต่ค่า Leased Time ที่ต่ำสุดคือ 24 ชม
จริงๆมันเซ็ตต่ำกว่านั้นได้ แต่มัน Save ไม่ได้ ก็ไม่รู้เหมือนกันมันเป็นที่อะไร แต่ช่างเถอะ อันนี้ก็ปัญหานึงและ
 
2. พอเซ็ต Subnet เป็น /23 ทำให้ Client ใน Network เดียวกันเยอะมากขึ้นเป็นเท่าตัว และที่นี่ใช้ Wireless LAN หมดเลยจ้าาาา ไม่มี LAN สำหรับ PC ซักเส้นเลย ผลก็คือ Broadcast กระจาย .. Network Performance Drop สุดๆ
 
3. ที่นี่ใช้ Edge Router เป็น Main Gateway แล้วก็มี Internet สองค่ายให้บริการอยู่
เส้นแรกเป็น Internet บ้าน เอาไว้ใช้เปิดเว็บทั่วไป
เส้นที่สองก็เป็นเน็ตบ้าน อีกยี่ห้อเอาไว้กันล่ม
เส้นที่สามเป็น Corporate Link เอาไว้ใช้สำหรับงานด้านการเงินที่กลุ่ม Server สามารถ Access ได้เท่านัน
 
ลูกค้าเล่าว่า พอเปิดระบบ Load Balance ทีไร แทนที่ Internet จะเร็วขึ้น แต่กลับช้าาาา อืดกว่าเดิมอีก ก็งงว่า ทำอะไรผิด สุดท้ายก็ทำ Load Balance ไม่ได้ ต้องใช้ Internet เส้นเดียว เลยอยากให้ผมทำระบบ Load Balance บน EdgeRouter
เอาล่ะ งานที่ทำ Brief ดูไม่ยาก แต่ตอนทำจริงนี่แทบจะพ่นไฟเป็นก็อตซิลล่าเลยทีเดียว ปัญหาที่เกริ่นมาตอนแรก แก้ได้ แต่มาปวดหัวกับ เรื่องที่ไม่เป็นเรื่องนี่แหละครับ
 

มาดูแนวทางแก้ปัญหาก่อน

 
สำหรับปัญหาแรก ที่ Network /23 ไม่พอใช้เนี่ย ลูกค้า ก็ถามว่างั้นเราขยายเป็น /22 เลยไม๊
ผมเสนอไปว่า มันคงแก้ปัญหาเรื่อง IP ไม่พอใช้ได้ แต่มันเป็นการแก้ปัญหาปลายเหตุ แถมยังก่อปัญหาใหม่นั่นก็คือ เรื่อง Broadcast ยังไม่หายไป
เลยเสนอทางแก้คือ ทำ VLAN ให้ทุกชั้น เลย
 
ตึกมี 6 ชั้น ก็เอาไป 6 VLAN แต่ละ VLAN ใช้ /24 พอ จัดการง่าย Network ไม่ใหญ่มาก มองดูด้วยตาเปล่าก็เข้าใจ
จากนั้นก็ทำ Port Isolation เพื่อกัน Broadcast บน Switch Port จะได้ Performance ของ Network คืนมา
จากนั้นก็ย้าย VLAN Interface จากบน Core Switch Cisco มาที่ EdgeRouter แทน เพราะมันเป็นรุ่น EdgeRouter12 ตัว throughput มันไหวอยู่แล้ว จากนั้นก็ปลด Cisco SG300-52 ให้เหลือแค่ L2 Mode พอ
 
ที่ย้ายมาที่ EdgeRouter เพราะว่า หน้า Management ดูง่ายกว่า Assign ค่าต่างๆก็ง่ายกว่า Cisco เยอะ เจ้า Cisco SG นี่ก็ประสาทแดก แพงซะเปล่าหน้าเว็บอย่างกาก Monitor อะไรไม่ได้เล้ย
 
ปัญหาเรื่อง Load Balance ที่พอทำสองเส้นปุ๊บแล้วความเร็วอืดกว่าเดิม
พอไปไล่ปัญหาก็พบว่า Internet เส้นที่สองเจ้าที่ลูกค้าใช้ เหมือนมันจะมีปัญหากับค่า MTU ที่ใหญ่เกินไป แล้วมันไม่ Fragment Packet ออกไปให้ครับ
 
 
MTU ย่อมาจาก Max Transmission Unit มันเป็นค่าที่กำหนดว่า ขนาดของตระกร้าใส่ข้อมูลของเราจะมีขนาดเท่าไหร่ ซึ่ง ต้นทางปลายทาง ต้องกำหนดค่า MTU ที่สอดคล้องกัน ถึงจะส่งข้อมูลไปได้
 
แต่ว่าเวลาเราออก Internet เนี่ย ถึงแม้ว่าค่า MTU มันจะใหญ่ แต่เมื่อวิ่งผ่าน Router มันจะมีการทำ Fragmentation เพื่อหั่นค่าที่เกินออก แล้วเอา Data ไปยัดไว้ที่ตระกร้าอีกใบ แล้วส่งไป ก็จะทำให้ส่งไปได้
ซึ่งเจ้า EdgeRouter มันก็ตั้งค่า MTU ไว้ที่ 1492 ตามค่า Default ของ Router ทั่วๆไปที่เค้าเซ็ตกัน
ความแปลกของมันก็คือ เมื่อวิ่งเข้าไปในเครือข่ายของ Network เจ้านี้ มันเปิดเว็บได้ แต่อืดๆ แถมกด Speedtest ก็ไม่ขึ้น อารมณ์เหมือนถ้ามันเลี้ยวไปยัง Server หรือ Network บางเส้นทางแล้วมันจะ Drop Packet ทิ้งไปเลย
 
ผมเลยลองค่อยๆลดค่า MTU ลงไปเรื่อยๆ จนกระทั่ง MTU เหลือ 1420 ทุกอย่างถึงจะกลับมาลื่นเหมือนเดิม
ซึ่งอันนี้ก็สอดคล้องกับที่ลูกค้าบอกว่า พอเปิดระบบ Load Balance แล้ว Internet อึดดดกว่าเดิมมาก เพราะว่า ในจังหวะที่เปิดเว็บ ถ้าเกิดมัน random ไปออก Internet เส้นสอง แล้ว ไปเข้า Network ที่มันไม่ยอม Fragmentation มันก็จะ Drop Packet ทิ้งทันที ทำให้เปิดเว็บอะไรก็ไม่ขึ้น ดูเหมือนช้าไปหมด แล้วมันก็ Random ด้วย เพราะแล้วแต่เลยว่า ใครใน Office จะถูก Random ไปออก Intenret เส้นนี้ และวิ่งไปออกขา Network ที่มันมีปัญหา
 
พอแก้เรื่อง MTU ได้ก็จบ สามารถทำ Load Balance ได้และ
 

ทีนี้กลับมาที่ทำไมถึงแก้ปัญหายากเย็น ทั้งๆที่วิเคราะห์ปัญหาได้แล้ว

 
 
1. EdgeRouter เองก็เป็น Router ที่แบบ หงุดหงิดอยากบีบคอ คนเขียนโปรแกรม เวลาเปิดหน้าเว็บเพื่อเข้าไป Config มัน มันจะมีโอกาสที่อยู่ดีๆ Browser Freeze ไปเลยครับ หน้าค้าง แล้วไอ้ที่เรากด Config ไว้ก็หายไป แล้วเป็นอย่างบ่อย กว่าจะ Config แต่ละหัวข้อให้จบไปได้ ต้อง Reload แล้ว Reload อีก
อัพ Firmware ก็ไม่หาย เข้าไปค้นดูใน Forum ก็มีแต่คนบอกว่า FIrmware 2.x มัน Buggy ให้ถอยกลับมา ver 1.x เถอะ
ซึ่งกว่าจะรู้ว่ามัน Buggy ก็ Config เสร็จไปแล้วเหอะ เวงเอ๊ยยยย
 
2. ไม่มีผังสาย และไม่มีผัง Client บน Switch Cisco
ลูกค้าเดิน LAN ไว้เยอะมาก แต่เป็น LAN ของกลุ่ม CCTV ผสมกับ VOIP Phone เรียกได้ว่า Port เต็ม แต่ไม่รู้ว่าอะไรไปไหนบ้าง
ผมก็ต้องค่อยๆด้นเอาจาก VLAN Config ใน Cisco แต่ใน Config มันก็ไม่ได้มี Comment บน Port ไว้ เลยต้องมาเดาผ่าน VLAN และสถานะของ Port เอา เพื่อที่จะทำ Map สายใหม่ทั้งตึก (จริงๆเสนอ Test สาย + ทำ Label สายด้วย Fluke ไปแล้ว แต่ลูกค้าไม่เอา ฮืออ 😭)
เลยต้องมานั่งหาผ่าน Dashboard ที่ก็ Hang บ่อย และช้าพอๆกับนัง EdgeRouter เล้ยยยยย
ใช้เวลาประมาณ 6 ชั่วโมงในการไล่สายทั้งตึก แล้วก็ไล่ Config อุปกรณ์ใหม่ทั้งตึกอีกประมาณ 6 ชั่วโมง เข้า Site ลูกค้าเที่ยงวัน ออกเที่ยงคืนพอดี แทบสลบ
 
วันนี้เป็นวัน Online ระบบวันแรก ยังไม่เจอปัญหาอะไรใหญ่ๆ กริ๊ดกร๊าดมา ก็ขอภาวนาให้มันราบรื่น แล้วก็รอบหน้าขอให้ลูกค้าเปลี่ยนเจ้า Cisco SG ออกด้วยเถอะ เพี้ยงงงงง
——————————-
สำหรับลูกค้าท่านใดที่ Network ใน Office มีปัญหา อยากให้แก้ไข หรืออยากทำใหม่ ทีมงาน #vronline ยินดีรับใช้นะครับ
ขอเพียงจองคิวทำ Site Survey เพื่อวิเคราะห์ว่าจะแก้ปัญหายังไง แล้วเดี๋ยวค่อยมาหารือเรื่อง Solution กันครับ
ติดต่อได้ที่ คุณจอย 088-874-6271 / [email protected] ในเวลา Office-Hours ปกติได้เลยนะคร้าบบบบ
ขอบคุณคร้าบบบบ
——————————-