Compute4PUNCH و Storage4PUNCH: البنية التحتية الموحدة لفيزياء الجسيمات والفيزياء الفلكية والفيزياء النووية

1. المقدمة

يمثل تحالف PUNCH4NFDI (الجسيمات، الكون، النوى والهادرونات من أجل البنية التحتية الوطنية لبيانات البحث)، والذي تموله مؤسسة الأبحاث الألمانية (DFG)، ما يقارب 9000 عالم من مجتمعات فيزياء الجسيمات، والفيزياء الفلكية، وفيزياء الجسيمات الفلكية، وفيزياء الهادرونات، والفيزياء النووية في ألمانيا. وهو جزء من مبادرة NFDI الوطنية، وهدفه الأساسي هو إنشاء منصة موحدة لبيانات العلوم تتميز بخصائص FAIR (القابلية للاكتشاف، والوصول، والتشغيل البيني، وإعادة الاستخدام). تهدف هذه المنصة إلى توفير وصول سلس إلى موارد الحوسبة والتخزين المتنوعة وغير المتجانسة التي تقدمها المؤسسات الأعضاء، لمعالجة التحدي المشترك المتمثل في تحليل أحجام البيانات المتزايدة بشكل كبير باستخدام خوارزميات معقدة. يركز هذا المستند على المفاهيم التقنية لـ Compute4PUNCH و Storage4PUNCH، والتي تشكل العمود الفقري لهذه البنية التحتية الموحدة.

2. البنية التحتية الموحدة للحوسبة غير المتجانسة – Compute4PUNCH

يتصدى Compute4PUNCH لتحدي الاستفادة الفعالة من مجموعة واسعة من موارد الحوسبة عالية الإنتاجية (HTC)، والحوسبة الفائقة الأداء (HPC)، والموارد السحابية المقدمة عينيةً والموزعة عبر ألمانيا. تختلف هذه الموارد في البنية المعمارية، وأنظمة التشغيل، ومجموعات البرمجيات، وآليات المصادقة.

2.1. البنية الأساسية ونظام التراكب

حجر الزاوية في Compute4PUNCH هو إنشاء نظام دُفعي تراكبي موحد قائم على HTCondor. الابتكار الرئيسي هو استخدام منظم الموارد الفوقي COBalD/TARDIS. يقوم TARDIS (الذي يعمل كمُرسل للموارد للجدولة في المكان) بدمج الموارد الخارجية غير المتجانسة بشكل ديناميكي وشفاف في تجمع HTCondor. يعمل كنظام "طيار"، حيث يقدم وظائف وهمية إلى المجموعات الخارجية (مثل أنظمة HPC القائمة على Slurm) التي تسحب بعد ذلك وتنفذ الوظائف الفعلية للمستخدم من قائمة الانتظار المركزية لـ HTCondor. يقلل هذا النهج من التدخل في الإعدادات التشغيلية الحالية لمقدمي الموارد، وهو شرط حاسم للتبني.

يمكن تمثيل منطق مطابقة الموارد والجدولة بشكل مجرد بواسطة دالة تحسين. لنفترض أن $R = \{r_1, r_2, ..., r_n\}$ هي مجموعة الموارد غير المتجانسة المتاحة، ولكل منها سمات مثل البنية المعمارية $arch(r_i)$، والنوى المتاحة $c(r_i)$، والذاكرة $m(r_i)$، ووقت انتظار قائمة الانتظار $w(r_i)$. ولنفترض أن $J = \{j_1, j_2, ..., j_m\}$ هي مجموعة وظائف المستخدم مع المتطلبات $req(j_k)$. هدف منظم الموارد الفوقي هو إيجاد تعيين $M: J \rightarrow R$ يحقق أقصى قيمة لدالة هدف $F$، وغالبًا ما تكون مجموعًا مرجحًا للكفاءة والعدالة:

$F(M) = \alpha \cdot \sum_{j_k} U(j_k, M(j_k)) - \beta \cdot \sum_{r_i} L(r_i, M^{-1}(r_i))$

حيث $U$ هي دالة منفعة تقيس مدى تلبية المورد لمتطلبات الوظيفة (مع الأخذ في الاعتبار توافق بيئة البرمجيات عبر CVMFS)، و $L$ هي دالة حمل تعاقب على الإفراط في استخدام أي مورد فردي. يحل COBalD/TARDIS هذه المشكلة الديناميكية للجدولة عبر الإنترنت بطريقة استدلالية.

2.2. الوصول وبيئة البرمجيات

يتم توحيد وصول المستخدم من خلال بنية تحتية للمصادقة والتفويض (AAI) قائمة على الرموز المميزة. نقاط الدخول الأساسية هي عُقد تسجيل الدخول التقليدية وخدمة JupyterHub، التي توفر واجهة ويب مألوفة للتحليل التفاعلي وإنشاء النماذج الأولية.

للتعامل مع تبعيات البرمجيات المتنوعة، تستفيد البنية التحتية من تقنيات الحاويات (مثل Docker، Singularity/Apptainer) و نظام ملفات الآلة الافتراضية التابع لـ CERN (CVMFS). يوفر CVMFS مساحة اسم قابلة للتوسع، للقراءة فقط، وموزعة عالميًا لتثبيتات البرمجيات. يتم نشر مجموعات البرمجيات الخاصة بكل مجتمع إلى مستودعات CVMFS، مما يضمن أن أي عقدة حوسبة، بغض النظر عن موقعها الفعلي، يمكنها الوصول إلى بيئة البرمجيات المطلوبة على الفور وبشكل متسق، مما يلغي عبء التثبيت المحلي.

3. البنية التحتية الموحدة للتخزين – Storage4PUNCH

يركز Storage4PUNCH على توحيد أنظمة التخزين المقدمة من المجتمعات البحثية، والتي تعتمد في الغالب على تقنيات dCache أو XRootD، وكلاهما راسخ في فيزياء الطاقة العالية (HEP).

3.1. استراتيجيات التوحيد والتخزين المؤقت

ينشئ التوحيد مساحة اسم موحدة، تسمح للمستخدمين بالوصول إلى البيانات عبر عناصر تخزين مؤسسية متعددة كما لو كانت نظامًا واحدًا. يتم استخدام تقنيات مثل بروتوكول التوحيد الخاص بـ XRootD و تجمع الواجهة الأمامية لـ dCache لتحقيق ذلك. يقوم النظام بتحديد موقع البيانات وتوجيهها بذكاء.

مكون حاسم قيد التقييم هو التخزين المؤقت. يمكن لطبقة تخزين مؤقت عالمية أو إقليمية أن تقلل بشكل كبير من زمن الوصول وحمل شبكة النطاق العريض لمجموعات البيانات التي يتم الوصول إليها بشكل متكرر. يمكن نمذجة معدل الضربات $H$ للتخزين المؤقت بحجم $S$ لنمط وصول إلى البيانات. إذا كانت احتمالية الوصول إلى عنصر البيانات $d_i$ تتبع توزيعًا شبيهًا بـ Zipf $P(i) \sim 1 / i^{\alpha}$، فإن معدل الضربات المتوقع للتخزين المؤقت LRU هو تقريبًا:

$H(S) \approx \sum_{i=1}^{S} P(i)$

حيث $\alpha$ هي معلمة الانحراف. لسير العمل العلمي مع إعادة استخدام عالية للبيانات (شائعة في سلاسل التحليل)، حتى أحجام التخزين المؤقت المتوسطة يمكن أن تنتج $H$ عالية، مما يبرر نشرها. كما يقوم المشروع بتقييم حلول معالجة البيانات الوصفية من أجل تكامل أعمق، بهدف توفير ليس فقط الوصول إلى الملفات ولكن أيضًا قدرات اكتشاف البيانات عبر الاتحاد.

4. التفاصيل التقنية والإطار الرياضي

يعتمد أداء الاتحاد على اكتشاف الموارد والجدولة بكفاءة. يمكن نمذجة حالة النظام كرسم بياني $G=(V,E)$، حيث تمثل الرؤوس $V$ الموارد (عقد الحوسبة، نقاط نهاية التخزين) وتمثل الحواف $E$ روابط الشبكة بعرض النطاق $bw(e)$ وزمن الوصول $lat(e)$. سير العمل $W$ هو رسم بياني دوري موجه (DAG) للمهام $T$ مع تبعيات البيانات $D$.

تصبح مشكلة الجدولة: وضع كل مهمة $t \in T$ على مورد حوسبة $r_c \in V_c$ وتوجيه بياناتها المدخلة المطلوبة من موارد التخزين $r_s \in V_s$ بحيث يتم تقليل إجمالي وقت الإنجاز (وقت اكتمال سير العمل)، مع مراعاة القيود:

$\text{minimize } \max_{t \in T} (ft(t))$
subject to:
$\forall r \in V_c, \sum_{t placed\ on\ r} c(t) \leq C(r)$ (سعة المعالج)
$\forall d \in D, \text{transfer\_time}(d) = \frac{size(d)}{\min\_bw(path)} + \sum_{e \in path} lat(e)$

حيث $ft(t)$ هو وقت انتهاء المهمة $t$، و $c(t)$ هو طلب المعالج الخاص بها، و $C(r)$ هي سعة المورد $r$. يستخدم النظام الموحد خوارزميات استدلالية داخل HTCondor و COBalD/TARDIS لتقريب حلول لهذه المشكلة NP-hard في الوقت الفعلي.

5. النتائج التجريبية وأداء النموذج الأولي

تقرر الورقة العلمية عن التجارب الأولية مع النماذج الأولية التشغيلية. بينما لم يتم تفصيل معايير أداء كمية محددة في المقتطف المقدم، فإن النص يشير إلى تنفيذ ناجح للتطبيقات العلمية على البنية التحتية الموحدة.

وصف الرسم البياني (مقاييس الأداء المستنتجة): من المحتمل أن يُظهر رسم بياني افتراضي للأداء مقياسين رئيسيين بمرور الوقت: 1) استخدام الموارد المجمعة عبر تجمع الاتحاد، موضحًا كيف يملأ نظام التراكب فجوات السعة بين المراكز المساهمة المختلفة بشكل فعال. 2) وقت إنجاز الوظيفة مقارنةً بين سيناريو الاتحاد واستخدام الموارد المعزولة. سيظهر النظام الموحد متوسطًا وتباينًا أقل في وقت الإنجاز، خاصة للوظائف ذات متطلبات الموارد المرنة، حيث يمكن توجيهها إلى الموارد ذات أقصر قائمة انتظار. سيظهر تكامل موارد HPC عبر TARDIS منحنى مميزًا، يضيف في البداية زمن وصول بسبب آلية الوظيفة الطيار ولكنه يوفر وصولاً إلى عقد عالية النوى غير متاحة بطريقة أخرى لأحمال العمل المناسبة.

يُذكر أن استخدام CVMFS قد نجح في توفير بيئات برمجية موحدة، وهو عامل نجاح حاسم لتبني المستخدمين. تم تنفيذ AAI القائم على الرموز المميزة، مما يوفر الأساس اللازم للوصول الآمن متعدد المؤسسات.

6. إطار التحليل: دراسة حالة مفاهيمية

الحالة: تحليل الفيزياء الفلكية متعددة الرسائل. يحتاج عالم فيزياء الجسيمات الفلكية إلى تحليل بيانات من انفجار أشعة غاما (GRB) اكتشفه Fermi-LAT و IceCube، وربطه بمتابعة بصرية من ASAS-SN. يتضمن سير العمل: أ) معالجة تيرابايت من بيانات الفوتون الأولية (Fermi) على مزرعة HTC مُحسنة للإدخال/الإخراج العالي. ب) تشغيل محاكاة مونت كارلو لإعادة بناء حدث النيوترينو (IceCube) على مجموعة HPC تحتوي على العديد من النوى. ج) إجراء تحليل للصور على البيانات البصرية باستخدام عقد GPU.

التنفيذ الموحد عبر Compute4PUNCH/Storage4PUNCH:
1. يقدم المستخدم وصفًا واحدًا عالي المستوى لسير العمل (على سبيل المثال، باستخدام لغة سير العمل المشتركة - CWL) عبر JupyterHub.
2. يقوم رمز AAI بمصادقة المستخدم عبر جميع الأنظمة.
3. يقوم نظام التراكب HTCondor، بتوجيه من COBalD/TARDIS، بتحليل DAG لسير العمل:
- يتم مطابقة المهمة أ وإرسالها إلى عمال HTC قريبين من التخزين المدعوم بـ dCache في DESY.
- يؤدي متطلب المهمة ب لـ 10,000 ساعة معالج إلى تحفيز TARDIS لتوفير فتحات على مجموعة HPC قائمة على Slurm في KIT.
- تُرسل المهمة ج إلى قسم GPU في جامعة بون.
4. تسحب جميع المهام مجموعة برمجيات التحليل المتطابقة (Python، مكتبات علمية محددة) من مستودع PUNCH CVMFS.
5. يتم تبادل البيانات الوسيطة عبر مساحة اسم Storage4PUNCH الموحدة (على سبيل المثال، باستخدام XRootD)، مع تقديم ملفات المعايرة التي يتم الوصول إليها بشكل متكرر من التخزين المؤقت الإقليمي.
6. يتم تجميع النتائج النهائية وإعادتها إلى المستخدم.

توضح هذه الحالة القيمة المقترحة: يتفاعل عالم الفيزياء مع بنية تحتية منطقية واحدة بدلاً من إدارة تسجيلات دخول منفصلة، وتثبيتات برمجية، ونقل بيانات عبر ثلاثة أنظمة متميزة.

7. الرؤية الأساسية ومنظور المحلل

الرؤية الأساسية: لا يبني PUNCH4NFDI حاسوبًا فائقًا آخر أحاديًا؛ بل يصمم طبقة اتحاد — "نظام تشغيل فوقي" للحوسبة البحثية غير المتجانسة على النطاق الوطني. إن ابتكاره الحقيقي هو التنسيق العملي للموارد الحالية المعزولة سياسيًا وتحويلها إلى خدمة متماسكة، مع إعطاء الأولوية للحد الأدنى من التدخل على النقاء التكنولوجي. هذا أقل شبهاً بـ Borg من Google وأكثر شبهاً بنظام مراقبة الحركة الجوية المتطور على مستوى الاتحاد الأوروبي لوظائف الحوسبة.

التدفق المنطقي: المنطق متكرر بأناقة. ابدأ بالقيود غير القابلة للتفاوض: لا تعطل العمليات التشغيلية الحالية للمجتمع. هذا يفرض بنية تراكبية قائمة على السحب (HTCondor + TARDIS) بدلاً من منظم مركزي قائم على الدفع. وهذا التراكب، بدوره، يستلزم آلية توصيل برمجيات عالمية (CVMFS/الحاويات) وطبقة هوية موحدة (رمز AAI). يتبع اتحاد التخزين مسارًا موازيًا، مستفيدًا من أدوات HEP المجربة (dCache/XRootD). التدفق بأكمله هو درس متقن في التصميم القائم على القيود، حيث يكون كل اختيار تقني نتيجة مباشرة للواقع الاجتماعي السياسي للتعاون متعدد المؤسسات.

نقاط القوة والضعف:
نقاط القوة: البنية المعمارية قابلة للتوحيد ببراعة. فهي توسع الحوكمة أفقياً بالتصميم، مما يخفض الحواجز أمام مقدمي الموارد الجدد. يقلل استخدام HTCondor و CVMFS من المخاطر الفنية من خلال الاستفادة من عقود من ثقة المجتمع والخبرة التشغيلية من تعاونات مصادم الهادرونات الكبير (LHC). يركز التركيز على الموارد "العينية" على الاستدامة المالية، محولاً مشكلة التجزئة إلى ميزة تنوع.
نقاط الضعف: الفيل في الغرفة هو عبء الأداء. الجدولة المزدوجة (منظم فوقي + نظام دفعي محلي) ونموذج الوظيفة الطيار يضيفان حتمًا زمن وصول، مما يجعله غير مناسب للوظائف MPI المترابطة بإحكام ذات الحبيبات الدقيقة — وهو قيد كبير لأحمال عمل HPC البحتة. الاعتماد على CVMFS، رغم متانته، يخلق نقطة فشل واحدة لتوصيل البرمجيات وقد يواجه صعوبة مع الأكواد عالية الملكية أو المرخصة. علاوة على ذلك، كما هو مذكور في مبادئ بيانات FAIR، فإن التشغيل البيني الحقيقي يتطلب بيانات وصفية غنية؛ يبدو أن وصف Storage4PUNCH الحالي يركز بشدة على الوصول على مستوى البايت، وليس الاكتشاف الدلالي.

رؤى قابلة للتنفيذ:
1. لفريق PUNCH: مضاعفة التركيز على توصيف الأداء. نشر معايير أداء شفافة تقارن بين إنتاجية وزمن وصول الوظيفة الموحدة مقابل الأصلية لسير العمل النموذجي. هذه البيانات حاسمة لإقناع مديري مراكز HPC والمستخدمين المتشككين. تطوير نموذج دعم "من المستوى الأول" لطبقة الاتحاد نفسها بشكل استباقي؛ حيث يصبح تعقيدها تبعية حرجة.
2. للتجمعات الأخرى (مثل المعلوماتية الحيوية أو علوم المناخ): لا تنسخ فقط مجموعة التقنيات. انسخ نموذج الحوكمة الذي مكّنها. الدرس الرئيسي هو اتفاقية "المساهمة العينية" التي تتماشى مع حوافز المؤسسات. ابدأ بتوحيد المصادقة وتوزيع البرمجيات، كما فعل PUNCH؛ فهذه أساسية.
3. لوكالات التمويل (DFG، الاتحاد الأوروبي): يجب أن يكون هذا النموذج مخططًا لطلبات البنية التحتية البحثية الوطنية المستقبلية. مول "اللاصق" (التنسيق، عمليات التطوير الأساسية لطبقة الاتحاد) ودع المؤسسات تمول "الطوب" (الحوسبة/التخزين الفعلية). هذا يستفيد من الاستثمارات الرأسمالية الحالية بشكل أكثر فعالية من بناء مرافق مركزية جديدة، وهو مبدأ تردد صداه في الرؤية الاستراتيجية للسحابة الأوروبية للعلوم المفتوحة (EOSC).

في الختام، يمثل Compute4PUNCH و Storage4PUNCH نموذجًا ناضجًا وعمليًا وقابلًا للتكرار بدرجة كبيرة للبنية التحتية العلمية واسعة النطاق في القرن الحادي والعشرين. فهو يتنازل عن بعض الأداء النظري مقابل مكاسب هائلة في إمكانية الوصول، والمرونة، والجدوى السياسية. سيُقاس نجاحه ليس بـ FLOPS، ولكن بعدد طلاب الدكتوراه الذين يمكنهم إكمال تحليلهم دون أن يصبحوا خبراء في إدارة الأنظمة لخمس مجموعات مختلفة.

8. التطبيقات المستقبلية وخارطة الطريق للتطوير

تضع بنية PUNCH4NFDI التحتية أساسًا للعديد من التطورات المستقبلية:

التكامل مع سير عمل التعلم الآلي: يمكن توسيع الاتحاد لدعم مسرعات الذكاء الاصطناعي/التعلم الآلي المتخصصة (مثل مجموعات NVIDIA DGX، أو Google TPUs) كنوع من الموارد. يمكن دمج أطر عمل مثل Kubeflow جنبًا إلى جنب مع HTCondor، مع إدارة TARDIS لوضع الوظائف الهجينة عبر موارد HTC التقليدية والموارد المركزة على التعلم الآلي.
وضع البيانات الاستباقي والجدولة الواعية بسير العمل: التحرك إلى ما وراء التخزين المؤقت، يمكن للنظام تنفيذ تجهيز البيانات التنبؤي. من خلال تحليل DAGs لسير العمل المقدمة من المستخدمين، يمكنه جلب مجموعات البيانات المطلوبة مسبقًا من نقاط نهاية Storage4PUNCH البعيدة إلى التخزين المؤقت المحلي بالقرب من موارد الحوسبة المجدولة قبل بدء تنفيذ الوظيفة، مما يخفي زمن نقل البيانات بشكل فعال. يتطلب هذا تكاملاً أوثق بين منظم الحوسبة الفوقي ومساحة اسم اتحاد التخزين وبيانات المراقبة.
التوسع إلى الحوسبة الطرفية: لمجالات مثل علم الفلك الراديوي أو فيزياء النيوترينو، حيث تولد المستشعرات تدفقات بيانات هائلة، يمكن لنموذج الاتحاد دمج مواقع الحوسبة الطرفية. يمكن لعملاء TARDIS خفيفي الوزن التشغيل في المراصد، وسحب مهام المعالجة المسبقة من قائمة الانتظار المركزية لتصفية البيانات وتقليلها في الموقع قبل نقل الأحداث ذات الصلة فقط إلى التخزين المركزي.
الحوسبة الخضراء والجدولة الواعية بالكربون: يمكن تعزيز منظم الموارد الفوقي ببيانات كثافة الكربون من شبكات الكهرباء عبر ألمانيا. يمكنه بعد ذلك توجيه الوظائف بشكل تفضيلي إلى مراكز البيانات في المناطق ذات الاختراق العالي للطاقة المتجددة (مثل طاقة الرياح في الشمال) في أوقات الذروة الإنتاجية، مما يقلل البصمة الكربونية للحوسبة واسعة النطاق — وهو أولوية ناشئة للبنى التحتية البحثية كما سلطت عليه الضوء مبادرة Carbon Call التابعة لمؤسسة Linux Foundation.
الاتحاد بين الدول مع الشركاء الدوليين: الخطوة المنطقية التالية هي ربط اتحاد PUNCH الألماني ببنى تحتية مماثلة في الخارج، مثل شبكة الحوسبة العالمية لمصادم الهادرونات الكبير (WLCG)، أو شبكة العلوم المفتوحة (OSG)، أو السحابة الأوروبية للعلوم المفتوحة (EOSC). سيخلق هذا بنية تحتية بحثية عالمية متعددة التخصصات، على الرغم من أنه سيثير تحديات كبيرة في مواءمة السياسات، والأمن، والمحاسبة.

9. المراجع

تحالف PUNCH4NFDI. "PUNCH4NFDI - الجسيمات، الكون، النوى والهادرونات من أجل NFDI." ورقة بيضاء، 2021.
Thain, D., Tannenbaum, T., & Livny, M. "Distributed computing in practice: the Condor experience." Concurrency - Practice and Experience, 17(2-4), 323-356, 2005. https://doi.org/10.1002/cpe.938
Blomer, J., et al. "CernVM-FS: delivering scientific software to globally distributed computing resources." International Journal of High Performance Computing Applications, 28(2), 158-174, 2014. https://doi.org/10.1177/1094342013509700
Giffels, M., et al. "COBalD/TARDIS – Dynamic, Pilot-based Resource Provisioning for a Federated HTCondor Pool." In Proceedings of CHEP 2018, 2018.
Wilkinson, M. D., et al. "The FAIR Guiding Principles for scientific data management and stewardship." Scientific Data, 3:160018, 2016. https://doi.org/10.1038/sdata.2016.18
European Commission. "European Open Science Cloud (EOSC) Strategic Implementation Roadmap." 2018.
Linux Foundation. "Carbon Call: A Global Initiative for Reliable Carbon Accounting." 2022. https://www.linuxfoundation.org/research/carbon-call
Zhu, J.-Y., Park, T., Isola, P., & Efros, A. A. "Unpaired Image-to-Image Translation using Cycle-Consistent Adversarial Networks." In Proceedings of the IEEE International Conference on Computer Vision (ICCV), 2017. (مذكور كمثال على حمل عمل حوسبي معقد يمكن أن يستفيد من الوصول الموحد إلى الموارد غير المتجانسة).