
تحديث: الأسباب الحقيقية وراء انقطاع خدمتيّ Azure و 365
أعلنت مايكروسوفت عن انقطاع عالمي يؤثر على بعض خدماتها مثل Microsoft Azure وMicrosoft 365. وقد أدت المشكلة إلى انقطاع الخدمة وصعوبات في الاتصال بخدمات Azure المختلفة في جميع أنحاء العالم، من بينهم Outlook وXbox Live وMinecraft.
وفقًا لموقع Downdetector، بلغت تقارير انقطاع خدمة Minecraft ذروتها في حوالي الساعة 9:30 صباحًا بتوقيت شرق الولايات المتحدة، واستمرت حتى منتصف النهار، بينما أبلغ لاعبو Xbox Live عن انقطاعات في الخدمة أيضًا.
أبلغ العملاء عن المشكلة في أوروبا في البداية، ولكن سرعان ما اتضح أنّ الانقطاع كان له تأثير عالمي، حيث أثّر على العملاء في جميع أنحاء العالم لتُعلِّق ميكروسوفت بأنها قد بدأت بالفعل في التحقيق بخصوص هذه المُشكلة.
استعانت مايكروسوفت على الفور بالعديد من فرق الهندسة لتشخيص المشكلة وحلها. وقد اعترفت الشركة بالمشكلة وقدمت تحديثات على صفحة Azure، وقالت:
لقد شارك العديد من فرق الهندسة في تشخيص المشكلة وحلها. سيتم تقديم المزيد من التفاصيل في أقرب وقت مُمكن، ولكن، دون تحديد وقت بعينه.
انقطعت الخدمة عن Azure حول العالم في المناطق التالية:
- مُعظم ولايات ومناطق الولايات المتحدة، وشرق ووسط كندا.
- جنوب البرازيل، جنوب شرق البرازيل، ووسط المكسيك.
- أوروبا: شمال وغرب أوروبا، وسط وجنوب فرنسا، غرب وجنوب المملكة المتحدة، شمال وغرب سويسرا، شرق غرب النرويج، شمال وغرب ألمانيا، وسط وجنوب السويد، وسط بولندا، شمال إيطاليا، وسط إسبانيا.
- آسيا: شرق وجنوب شرق آسيا، وسط وغرب وجنوب الهند، شرق وغرب اليابان، وسط وجنوب كوريا.
- أستراليا: شرق وجنوب شرق ووسط أستراليا.
- الشرق الأوسط: غرب جنوب وشمال جنوب أفريقيا، وسط وشمال الإمارات العربية المتحدة، وسط قطر، وسط بلاد الاحتلال.
أعادت شركة Microsoft توجيه طلبات المُستخدمين لمعالجة المشكلة، وتراقب الشركة الموقف بنشاط للتأكد من حله، وقالت:
تُظهر بيانات القياس عن بعد للمراقبة تحسنًا في توفر الخدمة، ونحن نواصل المراقبة لضمان التعافي الكامل.
أسباب انقطاع خدمات مايكروسوفت
أقرت شركة مايكروسوفت بأن ارتفاعًا غير متوقع في الاستخدام، يُعرف بهجمات الحرمان من الخدمة الموزعة (DDoS)، قد أدى إلى تدهور أداء خدمة Azure Front Door (AFD). وقد تسبب هذا في حدوث أخطاء متقطعة وانقطاعات في الخدمة وزيادة في زمن الاستجابة. وللتخفيف من حدة هذه المشكلة، قام فريق Azure بإجراء تغييرات في إعدادات الشبكة وتحويل مسارات الشبكة إلى مسارات بديلة.

على الرغم من أن معظم الشركات تمتلك إجراءات حماية ضد هجمات DDoS، إلا أن الهجوم الذي تعرضت له مايكروسوفت قد تسبب في تفعيل آليات الحماية الخاصة بها. ولكن، وللأسف، أدى خطأ في تنفيذ هذه الآليات إلى تفاقم تأثير الهجوم بدلًا من تخفيفه.
يعتقد شون رايت، رئيس أمن التطبيقات في Featurespace، أن هذا الانقطاع كان نتيجة لهجوم DDoS، على الرغم من وجود إجراءات حماية لدى مايكروسوفت. ويشير إلى أن الخطأ الذي وقع في برنامج الحماية من هجمات DDoS يشابه الخطأ الذي حدث مع CrowdStrike قبل بضعة أسابيع. ويؤكد رايت على أهمية اختبار البرمجيات بدقة لتجنب مثل هذه الأخطاء في المستقبل.
حل الأزمة بعد ساعات
أشارت بيانات القياس عن بُعد للمُراقبة إلى تحسُّن في توفر الخدمة بعد ذلك. ومع ذلك، تستمر بعض الخدمات والمناطق في الإبلاغ عن أخطاء مُتقطعة. ويقوم فريق Azure بالتحقيق بنشاط في هذه المشكلات وسيقدم تحديثًا عن جهود التخفيف الجارية.
أعلنت Microsoft أن تغييرات تكوين الشبكة الأخيرة نجحت في تخفيف تأثيرات ارتفاع الاستخدام الذي تسبب في حدوث أخطاء متقطعة في خدمات معينة. ومع ذلك، اعترفت الشركة بأن هذه التغييرات أدت إلى بعض الآثار الجانبية التي أثرت على خدمات ومناطق محددة.
يعمل فريق Azure بنشاط على تحديث نظام التخفيف لتقليل هذه الآثار الجانبية ويُطبّق ممارسات النشر الآمن لضمان السلاسة الشاملة. إذا كنت تواجه مشكلات في الاتصال بخدمات Azure، فإننا نوصي بما يلي:
- مراقبة صفحة حالة Azure: راقب صفحة حالة Azure الرسمية للحصول على أحدث التحديثات حول الانقطاع.
- فحص التحديثات: تحقق بانتظام من موقع Microsoft Azure على الويب وقنوات الوسائط الاجتماعية للحصول على أي تحديثات حول المشكلة.
الاتصال بدعم مايكروسوفت: إذا كنت تواجه مشكلات مُستمرة، ففكّر في الاتصال بالدعم للحصول على المساعدة.
متى ينتهي يوليو؟
يأتي هذا الانقطاع الجديد بعد مرور 11 يومًا فقط على الانقطاع الواسع الذي تسبب به تحديث من CrowdStrike، والذي أثر على حوالي 8.5 مليون جهاز كمبيوتر حول العالم. تسبب هذا التحديث الخاطئ في فوضى كبيرة في قطاع السفر، حيث أدى إلى تعطيل العمليات في المطارات وشركات الطيران على مستوى العالم. وقد أرجعت شركة CrowdStrike السبب إلى مشكلة في برنامج اختبار التحديثات الخاص بها، مما أدى إلى هذا الفشل الكبير لنظام Windows 11.
في ضوء الانقطاعات الأخيرة التي شهدتها خدمات مايكروسوفت السحابية، أكد جون كابل، نائب رئيس خدمات ويندوز والتسليم في الشركة، على ضرورة إعادة النظر في استراتيجيات مرونة نظام ويندوز. وتتمثل إحدى هذه الاستراتيجيات في التحول من الحلول المحلية التقليدية إلى حلول إدارة السحاب، مما سيعزز من قدرة النظام على التعامل مع الأخطاء والزيادات المفاجئة في الاستخدام.
إن اعتماد العديد من الأجهزة والخدمات على نفس البنية التحتية السحابية يجعل أي خلل فيها يؤثر على ملايين المستخدمين في وقت واحد. وهذا يسلط الضوء على الحاجة الملحة لتعزيز مرونة الأنظمة والخدمات السحابية وجعلها قادرة على استيعاب الأخطاء التقنية والزيادات المفاجئة في الاستخدام بكفاءة أكبر.
تؤكد هذه الأحداث على أهمية تطوير استراتيجيات جديدة لإدارة الأزمات التقنية، وتقديم حلول مبتكرة تضمن استمرارية الخدمات دون انقطاعات تؤثر على حياة الأفراد وأعمالهم. كما تثير تساؤلات حول مدى اعتمادنا على شركات التكنولوجيا العملاقة وتأثير أعطالها على عالمنا المتصل بشكل متزايد.
?xml>