in ,

مراجعة كتاب: الكل يكذب؛ البيانات الضخمة والبيانات الحديثة وقدرة الإنترنت على اكتشاف الخفايا – الجزء الأول

تكمن مشكلة العلوم الإنسانية في استبعاد إمكانية قبولها لفلسفة اختزالية، على عكس العلوم الطبيعية التي تهدف إلى الوصول إلى نظرية موحدة للكون، تختصر قانون كل شيء في معادلة واحدة، بينما لا تزال العلوم الإنسانية تعجز عن توحيد البشر في قانون واحد وخالد، ويُعَد تحقيق ذلك مثل السير في سبيل لامتناهٍ من الألغاز والتعقيدات التي يتركب منها سلوك البشر وطبائعهم،

«في ذكريات كلٍّ منّا أشياءٌ، لا يكشف عنها لكل الناس بالمرة، وإنما يبوح بها لأصدقائه فحسب. وهناك أشياء أخرى، قد لا يكشف عنها حتى لأصفى أصفيائه وخلانه، وإنما يظلّ محتفظاً بها لنفسه، وفي بئر عميقة الغور فوق كل ذلك. وهناك في الأخير أشياء أخرى، يخشى المرء أن يكشف عنها، حتى لنفسه هو بالذات.»

[ مذكرات قبو- دوستويفسكي، ص:63 ]

خطت أناملُ عالم النفس التجريبي “ستيفن بنكر” مقدمةَ الكتاب كي يبلور بدوره هذه الفكرة، ويناقش محاولات علم النفس وعلم الاجتماع في كشف خصائص النفس البشرية، إلا أن جميع الأساليب من مثل قياس زمن ردات الفعل واتساع حدقة العين والتصوير العصبي الوظيفي، لم تقدم تصورًا للعقل بحكم التركيبة المعقدة والمتشابكة لأفكار الإنسان وأحكامه والتي تحول دون فهمنا لآلية التفكير عند البشر. ولا يمكننا التنبؤ بمستقبل يتعلق بهذ الظاهرة، إلا بالتخمينات وتعميم نتيجة عينة على المجتمع.

يأتينا سيث ستيفنز دافيدوتس بهذا المؤلف ليُطلعنا على منهج جديد في دراسة العقل يرتبط بقوة الثورة المعلوماتية والبنايات الضخمة؛ إذ يميط سيث اللثام عن مجموعة من الأبحاث والاستجابات الإلكترونية التي يُفصح البشر  عنها حين انفرادهم بأنفسهم.

مقدمة:

«إن هذا العمل اليومي المتمثل في كتابة كلمة أو عبارة في خانة مستطيلة صغيرة بيضاء يترك أثراً صغيراً يرشدنا إلى الحقيقة، وعندما يتضاعف العدد إلى ملايين، سيكشف في نهاية المطاف عن الحقائق العميقة.»

بصفة سيث خبيراً اقتصادياً وكاتبَ رأي في صحيفة نيويورك تايمز، وعالم البيانات السابق في جوجل، كانت مهنته تخوّل له اقتفاء الآثار الرقمية التي يخلّفها الناس وراءهم لشق طريقهم عبر شبكة الإنترنت عن طريق الأزرار ومفاتيح النقر والاختيار وما إلى ذلك. ومن هنا يستهل سيث مقدمة كتابه في إبراز أهمية عمليات البحث التي يقوم بها البشر عن معلومات مرتبطة بزمان ومكان معيّنين، وهذه المعلومات تُعَد بدورها معلومات مهمة بالنسبة إلى عالم البيانات فهي تساعده على الكشف عن حقائق تخص تفكير البشر ورغباتهم ومخاوفهم وسلوكياتهم.

يفتح لنا المؤلف النافذةَ لإطلالة جديدة على بواطن النفس البشرية، فتحليل البيانات، تتدفق معه العديد من الاكتشافات في شتى المجالات الاجتماعية والاقتصادية وحتى السياسية؛ إذ يزعم أن انتشار البيانات الجديدة في عصرنا الرقمي ستوسع من فهمنا للبشرية جذرياً،

« فكما أن المجهر يُظهر لنا أن قطرة من ماء البركة تحمل معها أكثر مما كنّا نعتقد بأننا نراه، وكما أن التيليسكوب قد كشف لنا أن سماءنا المظلمة تحمل في جوفها أكثر مما كنّا نعتقد أننا نراه، كذلك؛ تكشف البيانات الرقمية المعاصرة لنا أن لدى الجنس البشري أشياء أبعد مما كنا نعتقد أننا نراها، وقد تكون هي مجهر أو تلسكوب عصرنا التي يمكننا من خلالها أن نعثر على رؤى مهمة إن لم تكن ثورية.»


لِصقل الفكرة التي تشكّل جوهر الكتاب وهي قوة علم البيانات، لا بد من أن يطرح لنا سيث العديد من الأمثلة والإحصاءات التي تبرهن على دور الثورة الرقمية في كشف المستور وتقصي أغوار النفس البشرية؛ لكنّني سأتفادى طرح أغلبها أو التطرق إلى تفاصيلها، لأنها تشكل جزءاً كبيراً من المتعة التي يقدمها الكتاب والهدفُ من مراجعتي تشجيعُ القارئ وتشجيعه لخوض تجربة المتعة ذاتها التي أتيحت لي.

اقرأ أيضا (على موقع الفضائيون): علم البيانات، ثورة القرن!

البيانات التقليدية:

«وأنت أيضاً عالم بيانات! فيَوم أن كنت طفلاً، هل لاحظت أنك عندما تبكي تستجلب انتباه أمك؛ إن هذا هو علم البيانات؛ لكن ما إن صرت بالغاً، حتى بدأت تلاحظ أن المبالغة في التشكّي تقلّل من صحبة الناس، هذا هو علم البيانات أيضاً، وعندما يقلُّ احتكاك الناس بك، تلاحظ أن ذلك يقلّل من سعادتك، ومع قلّة السعادة، تصبح أقلَّ لطافةً مع الآخرين، وعندما تكون أقلّ لطافة، تقلُّ رغبة الناس في قضاء أوقاتهم الممتعة بصحبتك؛ هذا هو علم البيانات… علم البيانات… علم البيانات.»

كل واحد منا يمتلك قاعدة كبيرة من البيانات والتي تتمثل في كل ما عشناه طيلة حياتنا من تجارِب مررنا بها، وأشخاص تعرفنا إليهم وأخبار وقصص سمعنا بها، وثقافتنا وتقاليدنا بل حتى البيئة والزمن كلها تتدخل في مجموعة بياناتنا الشخصية أو ما أطلق عليها سيث “البيانات التقليدية”.

تشغل هذه البيانات دور خبرة الحياة في التأثير أو التحكم بحدسنا الذي يمدنا بتصور عام عن طبيعة عمل العالم. غير أن حدسنا غير جدير بالثقة في أغلب مواقف الحياة ومنه لا يمكننا إطلاق العنان لما تمليه علينا خبرتنا وأحكامها ما دامت غير مقيدة بتحليل حاسوبي دقيق، على عكس البيانات الرقمية التي تزوّدنا بمعلومات لا يكتنفها الغموض ولا مجال للشك في صحتها.

ومن هذه الفكرة قد نتصور محادثة بين المؤلف وأحد أبرز علماء الاجتماع “زيجمونت باومان”:

*زيجمونت باومان: لقد أثارني هذا الجزء من كتابك كثيراً، فقد تطرقت فيه إلى استعانة الإنسان بخبرته في تحريك غريزة الحدس للحكم على التجارب/ المواقف..!!

*سيث ستيفنز: لقد تعمدت أن أفتتح الفصل الأول من الكتاب بموضوع الحدس نظراً لأهميته، فكثير منا يعتمد على الحدس دليلًا في الحياة، بينما قد نقع في فخ الإدراك بسبب نزعتنا إلى المبالغة في أهمية تجاربنا الخاصة.

*زيجمونت باومان: كنتُ قد تطرقت تقريباً لنفس المسالة، في كتابي “الحب السائل”، وناقشت الفكرة في إطار خاص عن الحب والموت، « وبالطبع ربما نتعلّم من الأحداث الماضية حتى نكون أكثر حكمة بعد وقوعها، ونحاول أن نقتفي أثرها، ونؤسّس علاقة سببية بين الأحداث الماضية والأحداث التالية لها، ونحاول رسم سلسلة سببية معقولة لما حدث، وغالباً ما ننجح في ذلك. إننا نحتاج إلى ذلك النجاح لما يأتي به من راحة روحية؛ فهو يحيي، ولو بطريقة غير مباشرة، الإيمان بانتظام العالم وبإمكانية التنبؤ بالأحداث، وهما شرطان لا غنى عنهما لسلامة العقل. ثم إنّ هذا النجاح يخلق وهماً بحكمة مكتسبة، إنه وهم التعلّم،..»

*سيث ستيفنز: أحياناً يمكن لحدسنا أن يذهلنا بمفرده؛ ولكنه مع ذلك قد يوقعنا في أخطاء شنيعة! وكثيراً ما يجانب الدقة، فنحن بحاجة إلى البيانات لتوضيح الصورة، وليس لخبرتنا حتى وإن كانت تمتد لعقود من الزمن.

*زيجمونت باومان: « من يُصرّون على ربط أفعالهم بأفعال سابقة، يغامرون بمجازفات انتحارية ويجلبون لأنفسهم متاعب لا نهاية لها، مثلهم في ذلك كمثل الجنرالات المعروفين بخوض حروبهم التي انتصروا فيها، مرة أخرى.»

*سيث ستيفنز: صحيح؛ «إننا عندما نعتمد على حدسنا، فإننا قد نضلُّ الطريق بسبب أن الناس تنجذب للإثارة، فضلاً عن أننا نميل إلى المبالغة في تقدير انتشار القصة التي ربّما أصبحت شيئاً لا يُنسى، وعلى سبيل المثال: عندما يُسأل الناس في أحد الاستبيانات، فإنهم كثيراً ما يجعلون الأعاصيرَ السبب الأكثر شيوعاً للوفاة مقارنةً بمرض الربو؛ إلا أن الواقع يقول إن عدد الوفيات بسبب الربو تقدر بسبعين ضعفاً، ولكنّ حالات الوفاة بسبب مرض الربو لا يُعلن عنها، ولا تظهر في الأخبار مقارنة بوفيات الأعاصير.»

في نهاية الفصل، يتحدث سيث عن حلم طفولته، وكيف استغل هذه الفكرة مُنطلقاً لبحث آخر سيكتشف من خلاله كيف تصدمنا البيانات بنتائج تخالف توقعاتنا، فيقول: «إن هدف عالم البيانات فهم العالم، وبمجرد أن نعثر على النتيجة المخالفة للحدَس، يصبح بإمكاننا استخدام المزيد من علم البيانات لمساعدتنا في توضيح حالة العالم المختلفة عن ظاهرها.»

عن فرويد:

«لو تأمّلنا هذه المسألة لوهلة فسنرى أن استخدام البيانات، والإباحية- وبيانات البحث، ووجهات النظر التي تأتي معها- على نطاق واسع يُعَ أهم تطور في قدرتنا على فهم غريزة الجنس البشري.»

شملت قدرة البيانات إمكانيةَ التحقق من نظريات فرويد عن الغريزة الجنسية. ومن بين النظريات التي خضعت لبحث البيانات: الرموز القضيبية التي تظهر في الأحلام، وزلات اللسان أو الأخطاء المطبعيّة، فهما نظريتان قابلتان للتفنيد لكنهما تجانبان الصواب حسبما خلُصت إليه نتائج البحث عن طريق البيانات.

تتضح الصورة بعد أن يُكشف على معلومات مثيرةٍ قد تؤكّد على صحة أحد النظريات الفرودية؛ إذ أكدّت البيانات الإباحية وبيانات البحث أن الغريزة الجنسية يمكن أن تتشكل عبر تجارب الطفولة، ومن هنا أخذتنا البيانات إلى عالمٍ آخر، لتسلّط الضوء على ما كان من المستحيل التحقق منه وتحليله من قبلِ ظهور علم البيانات؛ لكنّ هذا الأخير، شكّل مفهوماً ثوريّاً في كيفية رؤيتنا لأنفسنا.

تتميز البيانات الإباحية وبيانات البحث بالصدق، ما يجعلها بمثابة مصل للحقيقة الرقمية في كشف ما لا يفشيه الناس من أفكار محرجة باستثناء اللجوء للإنترنت والإفصاح عمّا قد يخشون الاعترافَ به علناً، وهذا ما يسمح للبيانات الضخمة في الاطلاع على مصدر انجذابهم وحقيقة رغباتهم.

إعادة تصوّر البيانات:

يناقش الكاتب القوة الأولى للبيانات الضخمة والتي تتمثل في إعادة تصوّر البيانات؛ ففي غالب الأحيان لا تكمن قيمة البيانات الضخمة في حجمها وإنّما في قدرتها على توفير أنواع جديدة من المعلومات القابلة للدراسة، وهنا يطرح لنا محرك البحث “جوجل” باعتباره مصدراً مهيمناً لتوفير البيانات الضخمة -ليس فقط على مستوى الحجم وإنّما على مستوى الجودة أيضاً- فكما أكّد سيث: « إنّ الأمر يتعلق بجمع البيانات الصحيحة».

  • بيانات الأجساد:

غالباً ما يكون الهدف من استخدام البيانات: التنبؤ بالمستقبل لإحداث ثورة في مجال معيّن، وحسب المثال المطروح في خلال هذا الجزء كان الجسد عاملاً مهمًّا في تحقيق المبتغى، لذا؛ يتجلّى الدرس في الحكمة والدهاء عند استخدام بيانات جديدة، عليك أن تكون منفتحاً وذكيّاً ومرناً في تحديد نوعية البيانات، وعليك أن توسّع مجال بحثك خارج إطار المصادر التقليدية للبيانات؛ فالتفاصيل الدقيقة وحصولك على الأرقام الصحيحة لمعادلة التنبؤية سوف يكون بمثابة التحوّل الجذري في اكتشافك للمنظور الجديد الأصيل.

  • بيانات النصوص:

تؤدي الكلمات دور المحرّك في عالمٍ ضخمٍ كعالم البيانات، لذا سيكشف لنا سيث عن دور هذا النوع الجديد من البيانات في فهم الطبيعة البشرية.

لطالما شكّلت اللغة موضوعاً مهمّاً دى لعلماء الاجتماع، ولأن دراستها تتطلّب قراءة متأنيّة للعديد من النصوص، أصبح هذا الأمر سهلاً في عصر الرقمنة؛ إذ تحوّلت النصوص إلى بيانات وأصبحت اللغة خاضعة بدورها في التحليل التنبؤي للبيانات الضخمة، فأغلب الروابط التي استخدمتها جوجل مكونة من كلمات، بالإضافة لعمليات البحث كذلك، وعليه فقد كانت الوفرة في استخدام الكلمات هي السبب في تعيين قسم جديد خاص بالكلمات باسم: “بيانات النصوص”.

يبدو أن البيانات اللّغوية تتميّز بقوة ثورية في حياتنا المحوسبة، ومن بين التطورات في هذا الصدد، أداة “إنجرامز”: وهو مشروع قدمته جوجل بهدف رقمنة نسبة كبيرة من الكتب، وهذا يرجع لصعوبة حساب عدد الكلمات في النصوص القديمة لذلك فإنه بإمكان هذه الأداة أن تساعدك في فهم تاريخ اللغة، من خلال التعرف إلى كيفية انتشار استخدامات محددة للكلمات.

من بين الدراسات التي تمكنت بيانات النصوص من إطلاعنا عليها:

* الاعتقادات حول ما إذا كانت الولايات المتحدة دولة موحدّة أو مقسّمة.

* التنبؤ بشأن استمرارية المواعدة أو نجاح العلاقات من خلال الاعتماد على المحادثات الشخصية،  والاستعانة أيضاً ببيانات تقليدية للحصول على نتائج موثوقة، ويعرفنا سيث بصدد هذه الدراسة إلى حقائق مذهلة بخصوص ما يفضله كلٌّ من الجنسين، إ٠ذ يقول:

«ما يعجبني في هذه الدراسة هو أن البيانات الجديدة تخبرنا عن الأنساق التي كانت موجودة منذ فترة طويلة؛ ولكننا لم نكن بالضرورة مدركين لها، ولطالما تحدّث الرجال والنساء بأساليب مختلفة، …».

وقد وسعت هذه الأساليب المختلفة التي تُستخدم بين الرجال والنساء من نطاق الدراسة نحو استخدام الكلمات مع تقدم العمر، وقد أظهرت دراسة مشابهة للتغير الظاهر على استخدام الكلمات من سن المراهقة مروراً بسن الرشد وانتهاءً بسن الشيخوخة.

* دراسة حول تحليل المشاعر وتقدير مدى السعادة أو الحزن في القطعة النصيّة، عن طريق بناء مؤشر للمزاج. اعتمدت الدراسة أولاً تحديثات لحالات الفايسبوك، ولأن هذه الأخيرة ليست بمصدر موثوق لترميز شعور ما فقد لجأت إلى عمليات البحث في جوجل التي حصلّت نتائج معارضة لما نتداوله عادةً…

سأكتفي هنا عن طرح الدراسات؛ لأن الاكتشافات التي خلُصت إليها بيانات النصوص ستذهلك في كل مثال مطروح، فهي تمنحنا فرصة الاطلاع على إحصاءات غير مسبوقة حول ما نريده فعلاً.

تنقلنا البيانات اللغوية إلى معلومات أخرى مثيرة للاهتمام، بخصوص نوعية الأخبار التي يتشاركها الناس بكثرة، وكيف استغلت وسائل الإعلام هذه البيانات في التعرف إلى وجهات النظر التي يريدها الناس، من ثم ملء صفحات الأخبار بها، والكلمات كانت السبيل الأسمى في تفكيك وتحليل هذه الأخبار والآراء لاستغلالها في عملية تجارية من ترويج أكثر الأخبار رغبة من المتلقي.

  • بيانات الصور:

«كما رأينا بالفعل، فإن الكلماتِ بياناتٌ والنقراتِ بياناتٌ والروابطَ بياناتٌ وحتى الأخطاء المطبعية بياناتٌ؛ الموز في الأحلام بيانات، ونغمة الصوت بيانات، والصفير بيانات، ونبضات القلب بيانات، وأحجام الطّحال بيانات، وأظن أن عمليات البحث تُعَد أكثر البيانات إلهاماً.»

من بيانات النصوص ينقلنا الكاتب إلى “بيانات الصور”، نعم؛ تعَد الصور بيانات كذلك، بل في الواقع البيانات موجودة في كلّ مكان، لذا فقد أثبتت الصور بدورها قيمتها البيانيّة في التوصُّل إلى حقائق مبهرة من خلال الإحصائيات المدروسة وعمليات البحث الطويلة، وبرهنت هي الأخرى على أن مهمة عالم البيانات لا ينبغي أن تنحصر فقط في وجهات نظر ضيّقة ومنغلقة على التقليدي، بل عليه أن يكون حاذقاً في اختيار نوعية البيانات، وماهراً في جمعها وربطها بعضها مع بعض. وما دامت البيانات تحيط به أينما ذهب؛ أهم ما ينبغي أن يُركّز عليه هو الاستخدام الصحيح لها.

اقرأ أيضاً: كتاب: الاقتصاد في درس واحد

  • إعداد: شيماء بلالة.
  • تدقيق لغوي: نور عبدو.

ما رأيك في هذا المحتوى؟

شيماء بلالة

كتب بواسطة شيماء بلالة

اترك تعليقاً

لن يتم نشر عنوان بريدك الإلكتروني. الحقول الإلزامية مشار إليها بـ *

بين السوق الحر والرقابة الحكومية في مواجهة فيروس كورونا

رأسمالية الدولة؟ لا. القطاع الخاص هو محرك النمو الاقتصادي الصيني