Multi-WAN Failover บน MikroTik RouterOS 7 — สูตรการ Deploy สำหรับ SMB
คู่มือตั้งค่า Multi-WAN Failover และ PCC Load Balance บน MikroTik RouterOS 7 สำหรับ SMB ไทยที่ใช้ ISP สอง Operator พร้อม Health-check Script จริง
1. ทำไม SMB ไทยต้อง Multi-WAN — ISP ในไทย Downtime จริงๆ เท่าไหร่#
ISP ในไทยมี Downtime เฉลี่ยอยู่ที่ 10–30 ชั่วโมง/ปี ต่อ Operator ซึ่งฟังดูน้อย แต่สำหรับ SMB ที่ใช้ระบบ Cloud ERP, POS, หรือรับออเดอร์ผ่าน Line OA — แค่ 30 นาทีไม่มี Internet ก็กระทบรายได้ได้จริง True, AIS, 3BB ล้วนเคยมีเหตุ Fiber cut หรือ Core routing แบบไม่มีแจ้งเตือน เส้น 4G/5G LTE ของ DTAC/NT จึงกลายเป็น Backup ISP ยอดนิยมสำหรับ SMB ทั่วประเทศ
MikroTik RouterOS 7 รองรับ Multi-WAN ได้ครบทั้ง Failover และ Load Balance ในตัว ไม่ต้องซื้อ License เพิ่ม และยังมี Netwatch กับ Scripting Engine ให้เขียน Health-check เองได้อีกด้วย
2. 2 แบบที่นิยม: Active-Standby (Failover) vs Active-Active (PCC Load Balance) — ต่างกันยังไง#
Active-Standby (Failover) ใช้ ISP หลักปกติ พอ ISP หลัก Down ระบบสลับไป ISP สำรองโดยอัตโนมัติ เหมาะกับ SMB ที่เน้นเสถียรภาพและง่ายต่อการดูแล Connection ไม่ขาดระหว่างใช้งาน (ถ้า Failover เร็วพอ)
Active-Active (PCC Load Balance) ใช้ทั้งสอง ISP พร้อมกัน แบ่ง Connection ตาม Hash ของ Source/Destination IP เพิ่ม Throughput รวม แต่ซับซ้อนกว่า และอาจทำให้ Session บางตัวขาดเมื่อ ISP ใดใด Down
SMB ที่ไม่มี IT Staff ประจำควรเริ่มจาก Failover ก่อนเสมอ ง่ายกว่า แก้ปัญหาง่ายกว่า และเพียงพอสำหรับการใช้งาน 90% ของ SMB ทั่วไป
3. สูตรที่ 1: Failover (เน้นเสถียร, เรียบง่าย) — Config ทีละขั้นตอน#
สมมติ WAN1 = ether1 (True/AIS Fiber) และ WAN2 = ether2 (4G/5G LTE Router)
ขั้นตอนที่ 1: กำหนด IP Address และ Gateway
/ip address
add address=203.0.113.2/30 interface=ether1 comment="WAN1-True"
add address=192.168.100.2/30 interface=ether2 comment="WAN2-LTE"
ขั้นตอนที่ 2: ตั้งค่า Routing Table แบบ Distance
/ip route
add dst-address=0.0.0.0/0 gateway=203.0.113.1 distance=1 comment="WAN1-Primary"
add dst-address=0.0.0.0/0 gateway=192.168.100.1 distance=2 comment="WAN2-Backup"
RouterOS จะใช้ Route ที่ distance น้อยที่สุดก่อน เมื่อ WAN1 Gateway ไม่ตอบสนอง ระบบจะ Fallback ไป WAN2 โดยอัตโนมัติ แต่ต้องใช้ Recursive Routing ร่วมกับ Netwatch เพื่อ Detection ที่แม่นยำ (ดูหัวข้อ 5)
ขั้นตอนที่ 3: ตั้งค่า NAT Masquerade สำหรับทั้งสอง WAN
/ip firewall nat
add chain=srcnat out-interface=ether1 action=masquerade comment="NAT-WAN1"
add chain=srcnat out-interface=ether2 action=masquerade comment="NAT-WAN2"
4. สูตรที่ 2: PCC Load Balance (เน้น Throughput) — Config และข้อควรระวัง#
PCC (Per Connection Classifier) แบ่ง Traffic ตาม Hash ของ Packet Header ให้ Connection แต่ละ Session ไปเส้นเดิมตลอด ไม่ทำให้ TCP รีเซต
ขั้นตอนที่ 1: สร้าง Routing Table สำหรับแต่ละ WAN
/ip route
add dst-address=0.0.0.0/0 gateway=203.0.113.1 routing-table=WAN1 comment="WAN1-table"
add dst-address=0.0.0.0/0 gateway=192.168.100.1 routing-table=WAN2 comment="WAN2-table"
ขั้นตอนที่ 2: Mangle Rule สำหรับ PCC
/ip firewall mangle
add chain=prerouting in-interface=bridge-LAN \
per-connection-classifier=both-addresses-and-ports:2/0 \
action=mark-connection new-connection-mark=WAN1-conn passthrough=yes
add chain=prerouting in-interface=bridge-LAN \
per-connection-classifier=both-addresses-and-ports:2/1 \
action=mark-connection new-connection-mark=WAN2-conn passthrough=yes
add chain=prerouting connection-mark=WAN1-conn \
action=mark-routing new-routing-mark=WAN1 passthrough=no
add chain=prerouting connection-mark=WAN2-conn \
action=mark-routing new-routing-mark=WAN2 passthrough=no
PCC ไม่ได้เพิ่ม Speed ของ Connection เดียว เช่น การ Download ไฟล์ใหญ่ผ่าน Browser ยังได้ความเร็วจาก ISP เดียว ใช้ได้ดีเมื่อมีหลาย User ใช้งานพร้อมกัน
5. Health-check Script (Netwatch + Recursive Routing)#
Recursive Routing ให้ RouterOS ตรวจ Reachability ของ Gateway ผ่าน IP ปลายทางที่กำหนด แทนที่จะเช็คแค่ว่า Interface ยัง Up อยู่
ขั้นตอนที่ 1: กำหนด Recursive Route ชี้ไป Public IP เพื่อ Probe
/ip route
add dst-address=8.8.8.8/32 gateway=203.0.113.1 comment="WAN1-probe"
add dst-address=8.8.4.4/32 gateway=192.168.100.1 comment="WAN2-probe"
add dst-address=0.0.0.0/0 gateway=8.8.8.8 distance=1 check-gateway=ping comment="WAN1-recursive"
add dst-address=0.0.0.0/0 gateway=8.8.4.4 distance=2 check-gateway=ping comment="WAN2-recursive"
ขั้นตอนที่ 2: ตั้งค่า Netwatch เพื่อ Trigger Script
/tool netwatch
add host=8.8.8.8 interval=10s timeout=3s \
up-script="/ip route set [find comment=\"WAN1-recursive\"] distance=1" \
down-script="/ip route set [find comment=\"WAN1-recursive\"] distance=10" \
comment="WAN1-health"
add host=8.8.4.4 interval=10s timeout=3s \
up-script="/ip route set [find comment=\"WAN2-recursive\"] distance=2" \
down-script="/ip route set [find comment=\"WAN2-recursive\"] distance=10" \
comment="WAN2-health"
Netwatch จะ Ping ทุก 10 วินาที ถ้า Host ไม่ตอบสนองใน 3 วินาที Script down-script จะรัน เปลี่ยน Distance ให้ Route นั้นถูก Bypass ออกไป
ใช้ IP ของ ISP เองแทน 8.8.8.8 ถ้าต้องการเช็ค ISP Path โดยตรง เช่น DNS Server ของ True หรือ AIS เพื่อให้แน่ใจว่า Probe ไม่วิ่งข้ามไป ISP อื่น
6. ข้อผิดพลาดที่เจอบ่อย (DNS Leak, NAT Stuck, Asymmetric Routing)#
DNS Leak: เมื่อ Failover เกิดขึ้น DNS Cache เดิมที่ชี้ผ่าน WAN1 อาจยังค้างอยู่ แก้โดยใช้ DNS Server ของ Router ตัวเอง (/ip dns set servers=1.1.1.1,8.8.8.8) และบังคับ Client ให้ใช้ Router เป็น DNS
NAT Stuck: Connection ที่เปิดค้างผ่าน WAN1 อาจไม่ตายทันทีเมื่อ Failover ต้องรอ Connection Timeout หรือ Flush Connection Table ด้วย Script:
/ip firewall connection remove [find]
การ Flush Connection Table จะทำให้ทุก Session ขาดพร้อมกันชั่วคราว ทำเมื่อจำเป็นเท่านั้น
Asymmetric Routing: เกิดเมื่อ Packet ขาไปผ่าน WAN1 แต่ขากลับเข้ามา WAN2 ทำให้ Firewall ตัด Connection ทิ้ง แก้ด้วยการตั้งค่า connection-state ใน Firewall Rule และตรวจว่า Mangle Mark ถูกต้อง
7. อุปกรณ์ที่แนะนำ (hAP ax3, RB5009, CCR2004)#
hAP ax3 เหมาะกับ SMB ขนาดเล็กถึงกลาง มี Port 2.5G และ Wi-Fi 6 ในตัว รองรับ WAN สองเส้นได้สบาย ราคาอยู่ในช่วง 5,000–7,000 บาท
RB5009UG+S+IN เหมาะกับ SMB ที่ต้องการ Throughput สูงขึ้น มี SFP+ Port สำหรับ Fiber โดยตรง RAM และ CPU มากกว่า hAP ax3 เหมาะสำหรับ Office 50–200 คน
CCR2004-1G-12S+2XS ระดับ Enterprise สำหรับ SMB ที่มี Bandwidth รวมสูงกว่า 1 Gbps หรือต้องการ BGP/OSPF เต็มรูปแบบ ใช้ในสำนักงานที่มีหลาย Branch
SMB ทั่วไปที่มี User 20–80 คน และ Bandwidth WAN รวมไม่เกิน 500 Mbps — RB5009 คือ Sweet Spot ที่คุ้มค่าที่สุด
8. สรุป + Action Priority#
Multi-WAN บน MikroTik RouterOS 7 ไม่ใช่เรื่องซับซ้อน ถ้าเริ่มถูกทาง:
- เริ่มจาก Failover ก่อนเสมอ ตั้งค่าง่าย แก้ปัญหาง่าย เหมาะกับ SMB ที่ไม่มี IT Staff เต็มเวลา
- เพิ่ม Recursive Routing + Netwatch ให้ Detection แม่นยำขึ้น อย่าพึ่ง Interface Up/Down อย่างเดียว
- ทดสอบ Failover จริงก่อน Production ถอด Fiber WAN1 ออกแล้ววัดเวลาที่ Internet กลับมา ควรอยู่ที่ไม่เกิน 30 วินาที
- จัดการ DNS และ NAT ให้เรียบร้อย เพราะข้อผิดพลาดเหล่านี้คือสาเหตุหลักที่ Failover ดูเหมือนทำงาน แต่ User ยังเจอปัญหา
- พิจารณา PCC ก็ต่อเมื่อ Failover เสถียรแล้ว และมี IT ที่เข้าใจ Routing คอยดูแล
C9NETWORK ให้บริการ ออกแบบ และ Deploy MikroTik Multi-WAN สำหรับ SMB ทั่วประเทศ พร้อม Managed Monitoring ที่แจ้งเตือนเมื่อ ISP Down ก่อนที่ User จะโทรมาร้องเรียน ติดต่อทีมเราเพื่อประเมินระบบเครือข่ายของคุณได้เลย