به منظور پاسخگویی به نیازهای سرویسهای ابری، شبکه به تدریج به زیرلایه (Underlay) و روی هم رفته (Overlay) تقسیم میشود. شبکه زیرلایه (Underlay) تجهیزات فیزیکی مانند مسیریابی و سوئیچینگ در مراکز داده سنتی است که هنوز به مفهوم پایداری اعتقاد دارند و قابلیتهای انتقال داده شبکهای قابل اعتمادی را فراهم میکنند. روی هم رفته، شبکه تجاری محصور شده روی آن است که از طریق محصورسازی پروتکل VXLAN یا GRE به سرویس نزدیکتر است تا سرویسهای شبکهای با کاربرد آسان را در اختیار کاربران قرار دهد. شبکه زیرلایه (Underlay) و شبکه روی هم رفته (Overlay) مرتبط و جدا از هم هستند و به یکدیگر مرتبط هستند و میتوانند به طور مستقل تکامل یابند.
شبکه زیرلایه (Underlay) پایه و اساس شبکه است. اگر شبکه زیرلایه ناپایدار باشد، هیچ SLA برای کسب و کار وجود ندارد. پس از معماری شبکه سه لایه و معماری شبکه Fat-Tree، معماری شبکه مراکز داده در حال گذار به معماری Spine-Leaf است که سومین کاربرد مدل شبکه CLOS را رقم زد.
معماری شبکه سنتی مرکز داده
طراحی سه لایه
از سال ۲۰۰۴ تا ۲۰۰۷، معماری شبکه سه لایه در مراکز داده بسیار محبوب بود. این معماری دارای سه لایه است: لایه هسته (ستون فقرات سوئیچینگ پرسرعت شبکه)، لایه تجمیع (که اتصال مبتنی بر سیاست را فراهم میکند) و لایه دسترسی (که ایستگاههای کاری را به شبکه متصل میکند). مدل به شرح زیر است:
معماری شبکه سه لایه
لایه هسته: سوئیچهای هسته، ارسال پرسرعت بستهها به داخل و خارج از مرکز داده، اتصال به لایههای تجمیع چندگانه و یک شبکه مسیریابی L3 انعطافپذیر که معمولاً به کل شبکه سرویس میدهد را فراهم میکنند.
لایه تجمیع: سوئیچ تجمیع به سوئیچ دسترسی متصل میشود و سرویسهای دیگری مانند فایروال، تخلیه SSL، تشخیص نفوذ، تحلیل شبکه و غیره را ارائه میدهد.
لایه دسترسی: سوئیچهای دسترسی معمولاً در بالای رک قرار دارند، بنابراین به آنها سوئیچهای ToR (Top of Rack) نیز گفته میشود و به صورت فیزیکی به سرورها متصل میشوند.
معمولاً، سوئیچ تجمیع، نقطهی تمایز بین شبکههای L2 و L3 است: شبکهی L2 زیر سوئیچ تجمیع و شبکهی L3 بالای آن قرار دارد. هر گروه از سوئیچهای تجمیع، یک نقطهی تحویل (POD) را مدیریت میکنند و هر POD یک شبکهی VLAN مستقل است.
پروتکل حلقه شبکه و درخت پوشا
تشکیل حلقهها عمدتاً ناشی از سردرگمی ناشی از مسیرهای مقصد نامشخص است. وقتی کاربران شبکهها را میسازند، برای اطمینان از قابلیت اطمینان، معمولاً از دستگاههای اضافی و لینکهای اضافی استفاده میکنند، به طوری که حلقهها ناگزیر تشکیل میشوند. شبکه لایه ۲ در همان دامنه پخش قرار دارد و بستههای پخش به طور مکرر در حلقه منتقل میشوند و یک طوفان پخش تشکیل میدهند که میتواند باعث انسداد پورت و فلج شدن تجهیزات در یک لحظه شود. بنابراین، برای جلوگیری از طوفانهای پخش، لازم است از تشکیل حلقهها جلوگیری شود.
برای جلوگیری از تشکیل حلقهها و تضمین قابلیت اطمینان، فقط میتوان دستگاههای اضافی و لینکهای اضافی را به دستگاههای پشتیبان و لینکهای پشتیبان تبدیل کرد. یعنی پورتها و لینکهای دستگاه اضافی در شرایط عادی مسدود میشوند و در ارسال بستههای داده شرکت نمیکنند. تنها زمانی که دستگاه، پورت یا لینک ارسال فعلی دچار مشکل شود و منجر به ازدحام شبکه شود، پورتها و لینکهای دستگاه اضافی باز میشوند تا شبکه به حالت عادی بازگردد. این کنترل خودکار توسط پروتکل درخت پوشا (STP) پیادهسازی میشود.
پروتکل درخت پوشا بین لایه دسترسی و لایه سینک عمل میکند و در هسته آن یک الگوریتم درخت پوشا وجود دارد که روی هر پل فعالشده با STP اجرا میشود، که بهطور خاص برای جلوگیری از حلقههای پلزنی در حضور مسیرهای اضافی طراحی شده است. STP بهترین مسیر داده را برای ارسال پیامها انتخاب میکند و لینکهایی را که بخشی از درخت پوشا نیستند، رد میکند و تنها یک مسیر فعال بین هر دو گره شبکه باقی میگذارد و لینک بالارونده دیگر مسدود خواهد شد.
STP مزایای زیادی دارد: ساده، قابل نصب و اجرا (plug-and-play) است و به پیکربندی بسیار کمی نیاز دارد. دستگاههای درون هر pod متعلق به یک VLAN یکسان هستند، بنابراین سرور میتواند مکان را به طور دلخواه در داخل pod و بدون تغییر آدرس IP و دروازه (gateway) منتقل کند.
با این حال، مسیرهای ارسال موازی نمیتوانند توسط STP استفاده شوند، که همیشه مسیرهای اضافی را در VLAN غیرفعال میکند. معایب STP:
۱. همگرایی آهسته توپولوژی. هنگامی که توپولوژی شبکه تغییر میکند، پروتکل درخت پوشا ۵۰ تا ۵۲ ثانیه طول میکشد تا همگرایی توپولوژی را تکمیل کند.
۲. نمیتواند عملکرد متعادلسازی بار را ارائه دهد. وقتی حلقهای در شبکه وجود دارد، پروتکل درخت پوشا فقط میتواند حلقه را مسدود کند، به طوری که لینک نتواند بستههای داده را ارسال کند و منابع شبکه را هدر دهد.
مجازیسازی و چالشهای ترافیک شرق-غرب
پس از سال ۲۰۱۰، به منظور بهبود استفاده از منابع محاسباتی و ذخیرهسازی، مراکز داده شروع به پذیرش فناوری مجازیسازی کردند و تعداد زیادی ماشین مجازی در شبکه ظاهر شدند. فناوری مجازی، یک سرور را به چندین سرور منطقی تبدیل میکند، هر ماشین مجازی میتواند به طور مستقل اجرا شود، سیستم عامل، برنامه، آدرس MAC و آدرس IP مستقل خود را داشته باشد و از طریق سوئیچ مجازی (vSwitch) درون سرور به موجودیت خارجی متصل شوند.
مجازیسازی یک الزام همراه دارد: مهاجرت زنده ماشینهای مجازی، توانایی انتقال سیستمی از ماشینهای مجازی از یک سرور فیزیکی به سرور دیگر در عین حفظ عملکرد عادی سرویسها روی ماشینهای مجازی. این فرآیند برای کاربران نهایی حساس نیست، مدیران میتوانند منابع سرور را به صورت انعطافپذیر تخصیص دهند، یا سرورهای فیزیکی را بدون تأثیر بر استفاده عادی کاربران تعمیر و ارتقا دهند.
برای اطمینان از عدم قطع سرویس در طول مهاجرت، لازم است که نه تنها آدرس IP ماشین مجازی بدون تغییر باقی بماند، بلکه وضعیت در حال اجرا ماشین مجازی (مانند وضعیت جلسه TCP) نیز در طول مهاجرت حفظ شود، بنابراین مهاجرت پویای ماشین مجازی فقط میتواند در همان دامنه لایه ۲ انجام شود، اما نه در سراسر مهاجرت دامنه لایه ۲. این امر نیاز به دامنههای L2 بزرگتر از لایه دسترسی به لایه هسته را ایجاد میکند.
نقطه تقسیم بین L2 و L3 در معماری سنتی شبکه بزرگ لایه 2، سوئیچ هسته است و مرکز داده زیر سوئیچ هسته، یک دامنه پخش کامل، یعنی شبکه L2، است. به این ترتیب، میتواند به دلخواه بودن استقرار دستگاه و مهاجرت مکان پی ببرد و نیازی به تغییر پیکربندی IP و دروازه ندارد. شبکههای مختلف L2 (VLans) از طریق سوئیچهای هسته مسیریابی میشوند. با این حال، سوئیچ هسته تحت این معماری نیاز به نگهداری یک جدول MAC و ARP بزرگ دارد که الزامات بالایی را برای توانایی سوئیچ هسته مطرح میکند. علاوه بر این، سوئیچ دسترسی (TOR) نیز مقیاس کل شبکه را محدود میکند. این موارد در نهایت مقیاس شبکه را محدود میکنند، گسترش شبکه و قابلیت ارتجاعی، مشکل تأخیر در سه لایه برنامهریزی، نمیتواند نیازهای کسبوکار آینده را برآورده کند.
از سوی دیگر، ترافیک شرق-غرب که توسط فناوری مجازیسازی ایجاد میشود، چالشهایی را نیز برای شبکه سه لایه سنتی به همراه دارد. ترافیک مراکز داده را میتوان به طور کلی به دستههای زیر تقسیم کرد:
ترافیک شمال به جنوب:ترافیک بین کلاینتهای خارج از مرکز داده و سرور مرکز داده، یا ترافیک از سرور مرکز داده به اینترنت.
ترافیک شرق به غرب:ترافیک بین سرورهای درون یک مرکز داده، و همچنین ترافیک بین مراکز داده مختلف، مانند بازیابی اطلاعات پس از سانحه بین مراکز داده، ارتباط بین ابرهای خصوصی و عمومی.
معرفی فناوری مجازیسازی، استقرار برنامهها را بیش از پیش توزیعشده میکند و «اثر جانبی» آن افزایش ترافیک شرق به غرب است.
معماریهای سهلایه سنتی معمولاً برای ترافیک شمال-جنوب طراحی میشوند.اگرچه میتوان از آن برای ترافیک شرق به غرب استفاده کرد، اما در نهایت ممکن است نتواند آنطور که باید عمل کند.
معماری سه لایه سنتی در مقابل معماری Spine-Leaf
در یک معماری سه لایه، ترافیک شرق به غرب باید از طریق دستگاههای موجود در لایههای تجمیع و هسته هدایت شود. این ترافیک به طور غیرضروری از گرههای زیادی عبور میکند. (سرور -> دسترسی -> تجمیع -> سوئیچ هسته -> تجمیع -> سوئیچ دسترسی -> سرور)
بنابراین، اگر حجم زیادی از ترافیک شرق به غرب از طریق یک معماری شبکه سه لایه سنتی اجرا شود، دستگاههای متصل به یک پورت سوئیچ ممکن است برای پهنای باند رقابت کنند و در نتیجه زمان پاسخگویی ضعیفی برای کاربران نهایی به دست آید.
معایب معماری شبکه سه لایه سنتی
میتوان مشاهده کرد که معماری شبکه سه لایه سنتی کاستیهای زیادی دارد:
اتلاف پهنای باند:برای جلوگیری از ایجاد حلقه، پروتکل STP معمولاً بین لایه تجمیع و لایه دسترسی اجرا میشود، به طوری که فقط یک لینک بالارونده از سوئیچ دسترسی واقعاً ترافیک را حمل میکند و سایر لینکهای بالارونده مسدود میشوند که منجر به اتلاف پهنای باند میشود.
دشواری در استقرار شبکه در مقیاس بزرگ:با گسترش مقیاس شبکه، مراکز داده در مکانهای جغرافیایی مختلف توزیع میشوند، ماشینهای مجازی باید ایجاد و به هر مکانی منتقل شوند و ویژگیهای شبکه آنها مانند آدرسهای IP و دروازهها بدون تغییر باقی میمانند که نیاز به پشتیبانی از لایه ۲ دارد. در ساختار سنتی، هیچ مهاجرتی نمیتواند انجام شود.
کمبود ترافیک شرق به غرب:معماری شبکه سه لایه عمدتاً برای ترافیک شمال-جنوب طراحی شده است، اگرچه از ترافیک شرق-غرب نیز پشتیبانی میکند، اما کاستیهای آن آشکار است. وقتی ترافیک شرق-غرب زیاد باشد، فشار روی لایه تجمیع و سوئیچهای لایه هسته به شدت افزایش مییابد و اندازه و عملکرد شبکه به لایه تجمیع و لایه هسته محدود میشود.
این باعث میشود شرکتها در دوراهی هزینه و مقیاسپذیری قرار بگیرند:پشتیبانی از شبکههای با کارایی بالا در مقیاس بزرگ، نیازمند تعداد زیادی تجهیزات لایه همگرایی و لایه هسته است که نه تنها هزینههای بالایی را برای شرکتها به همراه دارد، بلکه مستلزم آن است که شبکه هنگام ساخت شبکه از قبل برنامهریزی شود. وقتی مقیاس شبکه کوچک باشد، باعث اتلاف منابع میشود و وقتی مقیاس شبکه همچنان در حال گسترش باشد، گسترش آن دشوار است.
معماری شبکه Spine-Leaf
معماری شبکه Spine-Leaf چیست؟
در پاسخ به مشکلات فوق،یک طراحی جدید برای مرکز داده، معماری شبکه Spine-Leaf، ظهور کرده است که ما آن را شبکه برگ-ریج مینامیم.
همانطور که از نامش پیداست، این معماری دارای یک لایه Spine و یک لایه Leaf است که شامل سوئیچهای spine و leaf میشود.
معماری اسپین-لیف
هر سوئیچ برگ به تمام سوئیچهای ریج متصل است که مستقیماً به یکدیگر متصل نیستند و یک توپولوژی تمام مش را تشکیل میدهند.
در روش spine-and-leaf، اتصال از یک سرور به سرور دیگر از تعداد یکسانی دستگاه عبور میکند (Server -> Leaf -> Spine Switch -> Leaf Switch -> Server)، که تأخیر قابل پیشبینی را تضمین میکند. زیرا یک بسته برای رسیدن به مقصد فقط باید از یک spine و leaf دیگر عبور کند.
اسپاین-لیف چگونه کار میکند؟
سوئیچ برگ: معادل سوئیچ دسترسی در معماری سنتی سه لایه است و مستقیماً به عنوان TOR (Top Of Rack) به سرور فیزیکی متصل میشود. تفاوت آن با سوئیچ دسترسی این است که نقطه مشخص کننده شبکه L2/L3 اکنون روی سوئیچ برگ است. سوئیچ برگ بالای شبکه 3 لایه و سوئیچ برگ زیر دامنه پخش مستقل L2 قرار دارد که مشکل BUM شبکه بزرگ 2 لایه را حل میکند. اگر دو سرور برگ نیاز به برقراری ارتباط داشته باشند، باید از مسیریابی L3 استفاده کرده و آن را از طریق یک سوئیچ Spine ارسال کنند.
سوئیچ Spine: معادل یک سوئیچ هسته. ECMP (Equal Cost Multi Path) برای انتخاب پویای چندین مسیر بین سوئیچهای Spine و Leaf استفاده میشود. تفاوت این است که Spine اکنون به سادگی یک شبکه مسیریابی L3 مقاوم برای سوئیچ Leaf فراهم میکند، بنابراین ترافیک شمال-جنوب مرکز داده میتواند به جای مستقیم، از سوئیچ Spine مسیریابی شود. ترافیک شمال-جنوب میتواند از سوئیچ لبه به موازات سوئیچ Leaf به روتر WAN مسیریابی شود.
مقایسه معماری شبکه Spine/Leaf و معماری شبکه سه لایه سنتی
مزایای برگ خاردار
تخت:طراحی مسطح، مسیر ارتباطی بین سرورها را کوتاه میکند و در نتیجه تأخیر کمتری ایجاد میکند که میتواند عملکرد برنامهها و سرویسها را به میزان قابل توجهی بهبود بخشد.
مقیاسپذیری خوب:وقتی پهنای باند کافی نیست، افزایش تعداد سوئیچهای ریج میتواند به صورت افقی پهنای باند را افزایش دهد. وقتی تعداد سرورها افزایش مییابد، اگر تراکم پورت کافی نباشد، میتوانیم سوئیچهای برگ اضافه کنیم.
کاهش هزینه: ترافیک شمال و جنوب، چه از گرههای برگ و چه از گرههای خط الراس. جریان شرق به غرب، توزیع شده در چندین مسیر. به این ترتیب، شبکه خط الراس برگ میتواند از سوئیچهای پیکربندی ثابت بدون نیاز به سوئیچهای ماژولار گرانقیمت استفاده کند و سپس هزینه را کاهش دهد.
تأخیر کم و جلوگیری از ازدحام:جریانهای داده در یک شبکه Leaf ridge صرف نظر از منبع و مقصد، تعداد گامهای یکسانی در سراسر شبکه دارند و هر دو سرور با سه گام Leaf > Spine > Leaf از یکدیگر قابل دسترسی هستند. این امر یک مسیر ترافیکی مستقیمتر ایجاد میکند که عملکرد را بهبود میبخشد و تنگناها را کاهش میدهد.
امنیت و دسترسی بالا:پروتکل STP در معماری سنتی شبکه سه لایه استفاده میشود و هنگامی که یک دستگاه از کار میافتد، دوباره همگرا میشود و بر عملکرد شبکه یا حتی از کار افتادن آن تأثیر میگذارد. در معماری leaf-ridge، هنگامی که یک دستگاه از کار میافتد، نیازی به همگرایی مجدد نیست و ترافیک همچنان از طریق مسیرهای عادی دیگر عبور میکند. اتصال شبکه تحت تأثیر قرار نمیگیرد و پهنای باند فقط به اندازه یک مسیر کاهش مییابد و تأثیر کمی بر عملکرد دارد.
متعادلسازی بار از طریق ECMP برای محیطهایی که از پلتفرمهای مدیریت شبکه متمرکز مانند SDN استفاده میشود، بسیار مناسب است. SDN امکان سادهسازی پیکربندی، مدیریت و تغییر مسیر ترافیک را در صورت انسداد یا خرابی لینک فراهم میکند و توپولوژی مش کامل متعادلسازی بار هوشمند را به روشی نسبتاً ساده برای پیکربندی و مدیریت تبدیل میکند.
با این حال، معماری Spine-Leaf محدودیتهایی دارد:
یکی از معایب این است که تعداد سوئیچها، اندازه شبکه را افزایش میدهد. مرکز داده با معماری شبکه برگ-ریج نیاز به افزایش سوئیچها و تجهیزات شبکه متناسب با تعداد کلاینتها دارد. با افزایش تعداد میزبانها، تعداد زیادی سوئیچ برگ برای اتصال به سوئیچ برگ مورد نیاز است.
اتصال مستقیم سوئیچهای ریج و ریج نیاز به تطابق دارد و به طور کلی، نسبت پهنای باند معقول بین سوئیچهای ریج و ریج نمیتواند از 3:1 تجاوز کند.
برای مثال، ۴۸ کلاینت با سرعت ۱۰ گیگابیت بر ثانیه روی سوئیچ برگ وجود دارد که ظرفیت پورت آنها در مجموع ۴۸۰ گیگابیت بر ثانیه است. اگر چهار پورت آپلینک ۴۰ گیگابیتی هر سوئیچ برگ به سوئیچ ریج ۴۰ گیگابیتی متصل شوند، ظرفیت آپلینک آن ۱۶۰ گیگابیت بر ثانیه خواهد بود. نسبت این دو ۴۸۰:۱۶۰ یا ۳:۱ است. آپلینکهای مراکز داده معمولاً ۴۰ گیگابیت یا ۱۰۰ گیگابیت هستند و میتوانند به مرور زمان از نقطه شروع ۴۰ گیگابیت (Nx 40G) به ۱۰۰ گیگابیت (Nx 100G) منتقل شوند. توجه به این نکته ضروری است که آپلینک همیشه باید سریعتر از داونلینک اجرا شود تا لینک پورت مسدود نشود.
شبکههای Spine-Leaf همچنین الزامات سیمکشی واضحی دارند. از آنجا که هر گره برگ باید به هر سوئیچ Spine متصل شود، باید کابلهای مسی یا فیبر نوری بیشتری نصب کنیم. فاصله اتصال، هزینه را افزایش میدهد. بسته به فاصله بین سوئیچهای متصل، تعداد ماژولهای نوری پیشرفته مورد نیاز معماری Spine-Leaf دهها برابر بیشتر از معماری سنتی سه لایه است که هزینه کلی استقرار را افزایش میدهد. با این حال، این امر منجر به رشد بازار ماژولهای نوری، به ویژه برای ماژولهای نوری پرسرعت مانند 100G و 400G شده است.
زمان ارسال: ۲۶ ژانویه ۲۰۲۶





