لماذا يجب علينا أن نفهم أهمية البيانات الضخمة واستخراج البيانات والاستعداد للمستقبل؟

في منشور المدونة هذا، سنلقي نظرة على سبب أهمية البيانات الضخمة واستخراج البيانات وكيف سيؤثر تطويرها على مستقبلنا.

 

في مرحلة ما، بدأنا نصادف مصطلح "البيانات الضخمة" غير المألوف في مختلف وسائل الإعلام. لم يمضِ سوى بضع سنوات على انتشار هذا المصطلح، لكننا أصبحنا على دراية به بالفعل. حتى أن مصطلحات مثل "التسويق باستخدام البيانات الضخمة" أصبحت شائعة. فما الذي يجذب كل هذا الاهتمام فيما يتعلق بالبيانات الضخمة واستخراج البيانات؟ للإجابة على هذا السؤال، علينا أولاً فهم مفهوم البيانات الضخمة وخلفيتها.
البيانات الضخمة تعني حرفيًا مجموعة ضخمة من البيانات. من الأرقام البسيطة إلى صور كاميرات المراقبة المعقدة، يمكن لأي بيانات يمكن تخزينها على وسيط تخزين أن تصبح بيانات ضخمة من خلال جمعها وتجميعها، بغض النظر عن صيغتها. المثير للاهتمام هنا هو أنه من حيث صيغ البيانات، لا يوجد فرق كبير بين البيانات التقليدية والبيانات الضخمة. مع ذلك، لو كانت البيانات الضخمة مجرد بيانات ضخمة، لكانت شائعة بالفعل في أواخر التسعينيات وأوائل الألفية الثانية، عندما كانت تكنولوجيا الحاسوب تتطور بسرعة. فلماذا أصبحت البيانات الضخمة موضوعًا ساخنًا في العقد الثاني من القرن الحادي والعشرين؟ يرتبط هذا ارتباطًا وثيقًا بالتطورات التكنولوجية الثلاثة المهمة التالية.
أولاً، العامل الأهم هو التحول الجذري في تطوير وحدات المعالجة المركزية (CPU). تُعدّ وحدة المعالجة المركزية (CPU) بمثابة عقل الحاسوب الذي يُجري العمليات الحسابية، وقد تطورت في الماضي بسرعة كبيرة لدرجة أن قانون مور، الذي ينص على أن أداء وحدة المعالجة المركزية يتضاعف كل 18 شهرًا، قد حظي بقبول واسع. ومع ذلك، في عام 2004، اصطدم تطوير وحدات المعالجة المركزية بحاجز يُعرف باسم "حاجز 4 جيجاهرتز". حتى ذلك الحين، كانت وحدات المعالجة المركزية تُطوّر بزيادة عدد الترانزستورات (عناصر الحوسبة) في النواة الواحدة (وحدة الحوسبة) لزيادة سرعتها. ومع ذلك، مع زيادة كثافة تكامل الترانزستورات، أصبح توليد الحرارة مشكلة خطيرة، مما استدعى اتباع نهج جديد. فبدلاً من زيادة عدد الترانزستورات في النواة الواحدة، طوّر مصنعو وحدات المعالجة المركزية وحدات معالجة مركزية متعددة الأنوية عن طريق وضع عدة أنوية في وحدة معالجة مركزية واحدة، مما أدى إلى تطوير تقنية معالجة البيانات بالتوازي. وقد أتاح ذلك معالجة كميات هائلة من البيانات التي كانت صعبة المعالجة سابقًا بسبب قيود سرعة المعالجة، بسرعة وكفاءة أكبر.
بالإضافة إلى ذلك، لعب التطور في وسائط التخزين دورًا هامًا في تدشين عصر البيانات الضخمة. وشهدت وسائط التخزين، مثل محركات الأقراص الصلبة (HDDs)، تحسينات هائلة في سعة تخزين البيانات وسرعتها. في الماضي، كانت سعة 1 جيجابايت هي السعة القياسية، أما الآن، فقد أصبحت محركات الأقراص الصلبة بسعات 8 تيرابايت أو أكثر شائعة، كما أدى ظهور وسائط التخزين عالية السرعة، مثل محركات الأقراص ذات الحالة الصلبة (SSDs)، إلى تحسين سرعة تخزين ومعالجة كميات كبيرة من البيانات بشكل كبير. وبفضل هذه التطورات التكنولوجية، أصبح من السهل الآن التعامل مع كميات كبيرة من البيانات التي كان من الصعب استخدامها سابقًا بسبب قيود التخزين.
في حين أن تطور وحدات المعالجة المركزية (CPU) ووسائط التخزين قد مكّن من الاستفادة من البيانات الضخمة، إلا أن التغييرات في طريقة جمع البيانات قد وسّعت نطاقها بشكل أكبر. وقد غيّر الانتشار السريع للأجهزة الذكية ووسائل التواصل الاجتماعي في العقد الأول من القرن الحادي والعشرين نموذج جمع البيانات. تجمع الأجهزة الذكية المتصلة بالشبكات، بشكل مباشر أو غير مباشر، بيانات المستخدم من خلال أجهزة استشعار مختلفة، مثل الكاميرات ونظام تحديد المواقع العالمي (GPS) وتقنية الاتصال قريب المدى (NFC)، وتُحمّل هذه البيانات إلى الشبكة آنيًا. بالإضافة إلى ذلك، يشارك مستخدمو وسائل التواصل الاجتماعي، مثل فيسبوك وتويتر، معلوماتهم الشخصية عبر الإنترنت طواعيةً، وهو ما يُمثّل أيضًا جزءًا كبيرًا من الكم الهائل من البيانات. في الماضي، كان من الشائع أن تجمع الجهات ذات الأغراض المحددة بيانات مستهدفة، أما الآن، فإن البيانات التي تُولّد باستمرار وتتدفق عبر الأجهزة الذكية ووسائل التواصل الاجتماعي تُجمع عشوائيًا. مع تطور تكنولوجيا الشبكات، يزداد اتصال المزيد والمزيد من الأشياء بالإنترنت، مما يُبشر بعصر إنترنت الأشياء (IoT) ويوسع نطاق جمع البيانات بشكل أكبر.
أدى الجمع بين تطوير وحدات المعالجة المركزية متعددة الأنوية، والتقدم في وسائط التخزين، وتوسيع نطاق جمع البيانات إلى ظهور مفهوم البيانات الضخمة. حاليًا، تقوم العديد من الشركات والهيئات الحكومية بتحليل البيانات الضخمة التي جمعتها وتسعى جاهدة للعثور على معلومات مفيدة داخلها. تؤكد وسائل الإعلام المختلفة باستمرار على أهمية البيانات الضخمة. ومع ذلك، فإن أهم سبب يدعونا إلى التفكير بعمق في البيانات الضخمة هو أن ما نشهده حاليًا ليس سوى البداية. في المستقبل، ستتطور وحدات المعالجة المركزية متعددة الأنوية لإجراء حسابات أسرع في وقت واحد، وستوفر وسائط التخزين سعات أكبر وسرعات أعلى. إلى جانب ذلك، ستزداد كمية البيانات المجمعة بشكل كبير مع تزايد عدد الكائنات المتصلة بالشبكات. قد تُعتبر البيانات الضخمة التي نعرفها اليوم صغيرة الحجم في عصر البيانات الضخمة الحقيقي في المستقبل.

 

عن المؤلف

كاتب

أنا "محقق القطط" وأساعد في إعادة القطط الضائعة إلى عائلاتها.
أستعيد نشاطي بفنجان قهوة لاتيه، وأستمتع بالمشي والسفر، وأوسّع مداركي بالكتابة. بمراقبة العالم عن كثب، واتباع فضولي الفكري ككاتبة مدونة، آمل أن تُقدّم كلماتي العون والراحة للآخرين.