التصنيفات
مقالات الضيوف

أي حد يقدر يخدعك باستخدام الإحصائيات

بالتلاعب في حجم العينة، قيم المحاور الرأسية والأفقية Scaling، التباعد بين كل قيمة والتانية Spacing، أو إني ما أبدأش قيمة المحور من الصفر

دايمًا في طرق معروفة عشان أي حد يقدر يخدعك باستخدام الإحصائيات، ده شيء حتى كتير من اللي شغالين في الإحصائيات فاهمينه كويس وعارفينه ودايمًا بيقولوه.

في الواقع، أشهر كتاب إتكتب في المجال ده ألفه إحصائي؛ داريل هاف الكاتب والباحث الأميركي في الرياضيات كان هو اللي كتب كتاب How to lie with statistics أو كيف تكذب باستخدام الإحصائيات، الكتاب اللي اترجم لعشر لغات على الأقل، واللي اتصنف كأكثر الكتب مبيعًا على مستوى العالم في النصف التاني من القرن العشرين.

الطرق المشهورة بتكون غالبًا في التلاعب في حجم العينة اللي بنستخرج منها الإحصائية، والقاعدة بتقول إن حجم العينة ده لازم يكون له قواعد، واختيار العينة لازم يكون مبني على أسس مش بس موضوعية ومنطقية، لكن ليها علاقة مباشرة بالإحصائية اللي مبنية عليها، أحيانًا حتى ضخامة حجم العينة ممكن يكون ليه تأثير سلبي، زي مثلًا لما تجيب الخريطة الحرارية الموسمية لإتنين لعيبة ارتكاز، مش حتعرف تستفيد منها حاجة لأنك مش حتعرف تفرق بينهم.

طريقة تانية بتستخدم في الرسوم البيانية مثلًا هي التلاعب في قيم المحاور الرأسية والأفقية Scaling، أو التباعد بين كل قيمة والتانية Spacing، أو إني ما أبدأش قيمة المحور من الصفر، وكل ده ممكن أعمله عشان أوحيلك إن تراجع صغير مالوش قيمة ممكن يبقى ضخم، أو أوحيلك إن ترند متصاعد مستمر ممكن يبقى خط ثابت يدل على الركود.

لكن الموضوع مش متوقف على الإحصائيات Stats وبس، حتى محاولات علماء البيانات لإيجاد أرقام أكتر تعبيرًا عن اللي بيحصل، وبتقيس النوع مش الكم بس، واللي بيسموها Analytics، هي كمان ممكن تخضع لنفس القواعد، ببساطة لأنه الهدف الأصلي من كل الخوارزميات الذكية والذكاء الاصطناعي وحتى تعليم الآلات Machine Learning، هو إننا نقدر نختصر أمور شديدة التعقيد في رقم واحد يعبر عنها..ليه محتاجين رقم واحد؟ لأنه دي الطريقة الأسهل للتواصل مع الزبائن المحتملين، أو أعضاء مجلس الإدارة في شركة ما، أو جمهور كرة القدم.

خلينا مثلًا ناخد حاجة زي الأهداف المتوقعة xG، واللي هي بتصنف Analytic مش إحصائية كمّية، وخلينا ناخد مثال زي جابرييل جيسوس، واخترته لأنه لاعب ما بيسددش كتير، بالتالي حساب عدد وجودة تسديداته يدويًا واحدة واحدة مش حيكون صعب زي صلاح مثلًا، وحأقولك ليه محتاجين نحسب عدد تسديداته وجودتها واحدة واحدة كمان شوية.

بالمناسبة، ده مالوش علاقة بإنه سجل هدف النهارده، كل الحسابات التالية عن الموسم اللي فات 2020-2021.

طبقًا لموقع Understat، أحد المواقع النادرة اللي بتقدملك مكان وجودة كل تسديدة لأي لاعب في الدوريات الخمسة الكبرى، وشوية معلومات عن سياقها زي كانت من لعب مفتوح ولا ركلة جزاء ولا كرة ثابتة، بيمينه ولا بشماله ولا براسه، في أي مباراة، في أي دقيقة، مين اللي مررهاله، إلخ.

طبقًا لـUnderstat، فجيسوس سدد 56 تسديدة في المجمل خلال الموسم اللي فات في البريميرليج، مرة تانية بأكرر، ده في البريميرليج بس، التسديدات دي مجموعها = 9.65 هدف متوقع، وجيسوس سجل 9 أهداف، إذن هو ناقص عن أهدافه المتوقعة بمقدار 0.65 هدف، ولو قارننا إجمالي أهدافه المتوقعة بمعدل مشاركته، فجيسوس بيحقق 0.42 هدف متوقع في المباراة الواحدة، ده معناه، بالطريقة البلدي، إن جيسوس ما ينفعش يعدي عليه مباراتين كاملين من غير ما يسجل هدف واحد عشان يكون مهاجم جيد وعلى قدر “المتوقع”.

الفقرة اللي فاتت دي هراء تام خام، مالهاش أي معنى أو مدلول أو قيمة إحصائية على الإطلاق، لا إيجابي ولا سلبي، مش عشان الإحصائيات في حد ذاتها خادعة أو مضللة، ومش عشان هي كافية/غير كافية للحكم على اللاعب، لكن ببساطة لأنك عشان تستخدم أي Stat أو Analytic لازم تتعلم بتتحسب إزاي، وقواعدها إيه، وتكون عارف حتى الأخطاء اللي بيقع فيها بعض المواقع بناءًا على الكلام ده، لو ما تعرفش فما تستخدمهاش أحسن لأنها حتوصلك لنتايج غلط.

الـ xG أو الأهداف المتوقعة عادة بيحصل فيها شوية أخطاء؛ أهمها وأبرزها إن الناس بتفترض إن المجموع ده (9.65 في حالة جيسوس) بيتكون من 9 أهداف كاملة وشوية فكة، وده بداهة غير صحيح، دي حقيقة مش رأي، أي رقم بيقيس قيمة الأهداف المتوقعة لأي لاعب في فترة زمنية معينة هو معبر عن قيمة “مجموع التسديدات اللي سددها”، مش “جودتها”.

حد هنا حيقول:”لهذا خُلقت المعدلات والمتوسطات”.
ده برضه غير دقيق، المعدلات والمتوسطات لوحدها مالهاش معنى برضه، عشان كده الخريطة دي مهمة إلى جانب الرقم عشان تقدر تاخد جزء من قيمته فعلًا.
(الصورة الأولى – حجم الدائرة بيدل على احتمالية تسجيل هدف من التسديدة) بعد ما تشوف الصورة الأولى، حتكتشف إن فيه تطرف واضح في جودة تسديدات جيسوس، بعضها فرص شديدة السهولة وبعضها فرص في منتهى الصعوبة، وعادة، مهاجم أساسي ثابت زي صلاح مثلًا حيبقى عنده التطرف ده أقل.

اللي فات حيخليك تفكر في المتوسط Average..
هل هو معبر فعلًا في الحالة دي؟
إحصائيًا، في تلات أنواع من المتوسطات داريل هاف ذكرهم في كتابه؛ Average = المعدل الحسابي = إجمع قيمة كل التسديدات وإقسمها على عدد التسديدات.
Median = المعدل الوسيط = رتب كل التسديدات حسب قيمتها من الأكبر للأصغر (أو العكس) وخد القيمة اللي في النص بالظبط.
Mode = المعدل الأكثر شيوعًا = خد من كل القيم، أكتر قيمة اتكررت، وده بيُنظر له على إنه المتوسط الأكتر تعبيرًا من الحقيقة، بشرط واحد بس، هو إنك لازم تقول نسبة الشيوع، يعني كام في المية من تسديدات جيسوس مثلًا كان قيمتها قد كده.

لو خدت كل تسديدات جيسوس الـ56 الموسم اللي فات ورتبتها من الأكبر للأصغر (أو العكس) وبعدين لونتها على حسب النتيجة اللي انتهت بيها زي ما هو ظاهر في الصورة الأولى، حتقدر من هنا تطلع كل المتوسطات وبعدين تقارنها ببعضها، عشان كده قلتلك إننا محتاجين لاعب نقدر نعد تسديداته وجودتها واحدة واحدة، وفي نفس الوقت العينة بتاعته كبيرة كفاية عشان تبقى معبرة، وعشان كده اخترت لاعب زي جيسوس.

لو حسبت الـ Average بتاع تسديدات جيسوس، يعني جمعت قيمهم وقسمتها على عدد التسديدات، حتكتشف إن كل تسديدة لجيسوس احتمالية تسجيلها = 0.17، يعني 17%.
(الصورة التانية)لاحظ إزاي مع أول محاولة للتدقيق نزلنا من 0.42 في المباراة الواحدة، واللي ناس كتير بتتخيل إنها جت في صورة تسديدة واحدة احتماليتها 42%، لـ0.17 لكل تسديدة، أقل من النص بمجرد ما بدأنا نحسب المعدل الحسابي Average، اللي هو أحقر أنواع المتوسطات وأكترها بدائية أصلًا، وبتستخدمه الدول المتخلفة في إحصائيات متوسطات الدخل عشان تخفي الفوارق الضخمة بين شرايحها وأفرادها، عشان كده بيكون معبر بس في الحالات اللي فيها تدرج منتظم في القيم ما بين الأكبر والأصغر.

لو بنفس الترتيب قررت تدور على الـ Median، اللي هو القيمة اللي في النص بالظبط، حتكتشف إنه 0.09، يعني احتمالية تسجيل التسديدة اللي موجودة في نص الطيف بالظبط = 9%. (الصورة التالتة)

لو من نفس الطيف حاولت تستنتج المتوسط الأكتر شيوعًا Mode، حتكتشف إن نسبة التسديدات اللي احتمالية تسجيلها ما بين 0-10% بتمثل 63% تقريبًا من تسديدات جيسوس.

ده المتوسط الأكتر شيوعًا في تسديدات جيسوس، ونسبته داخلة على تلتين تسديداته.

في الصورة التالتة كمان مقارنة بين مواقع التلات متوسطات، وتخيل إنه ده الفرق لو غيرت نوع المتوسط بس؛
أهداف متوقعة/المباراة = 0.42
Average = 0.17
Median = 0.09
Mode = 0-0.1

استفدنا إيه بقى من الصداع ده؟
* على مستوى نتيجة تسديدات جيسوس (هدف – تصدى لها الحارس – خارج المرمى – تصدى لها مدافع – في القائمين أو العارضة) إكتشفنا إن أكتر حالة بتتكرر مع جيسوس هي إن التسديدة تبقى Blocked باللون البنفسجي، بمعنى إن أحد المدافعين نجح في التصدي ليها وكتمها، ومن هنا، لما تروح لتحليل الفيديو، تقدر تبص على الحالات دي لوحدها عشان تخرج بخلاصة مفيدة؛ هل ده بيحصل بسبب إن جيسوس بيتأخر في التسديد مثلًا؟ ولا بيحصل لأنه ده السيتي وبيواجه تكتلات وده طبيعي؟

* على مستوى تقييم جيسوس نفسه كهداف، ومدى استغلاله للفرص المتاحة ليه، فهنا ييجي دور الصورة الرابعة، اللي هي بتبين لك كل مدى من تسديدات جيسوس (من 0% إلى 10% ومن 11% إلى 20% وهكذا) كان فيه كام تسديدة، وهو سجل من التسديدات دي كام هدف، وهو بيهدر إيه بالظبط، وبيسجل إيه بالظبط.

هنا تكتشف إن 78% من تسديدات جيسوس (44 تسديدة من إجمالي 56) كانوا من تسديدات احتماليتها ضعيفة (أقل من 30%) وإن مشكلته مع إهدار الفرص (مرة تانية في البريميرليج فقط) بتيجي في الفرص متوسطة الجودة (من 31% إلى 40% – 4 فرص كلها أهدرت) بينما في الفرص عالية الاحتمالية من 50% فما فوق هو عنده كفاءة تسجيل ومعدل تحويل قيمته 100%.

* تكتشف كمان إن إجمالي التسديدات شديدة الصعوبة (من 0% إلى 10%) يجمعوا 1.79 هدف متوقع بالطريقة البلدي بتاعت الموقع..جيسوس بقى سجل من الفرص دي كام هدف؟ هدف واحد بس، ورقميًا ده يبدو وكإنه بيأدي أقل من المتوقع في المساحة دي بفارق ضخم، لكن في الحقيقة، غالبًا مدربه مش متوقع إنه يسجل منها حاجة، ولا حتى هدف.

الأهم بقى؛ ده كله مش بيقول إن جيسوس هداف جيد أو هداف سييء، في عوامل تانية لازم تدخل في حساب المدرب/محلل الأداء عشان يقدر يقيس بيها العامل النفسي، أهمها مثلًا هو قيمة الهدف من حيث حالة المباراة، هل كان هدف تعادل أو فوز، ولا كان هدف مالوش عائد نُقَطي؟ هل كان الفريق مسيطر ومرتاح ولا مضغوط وبيدور على هدف؟ مباراة حاسمة في البطولة ولا مباراة بلا قيمة؟ وبالمناسبة، كل ده بقى ممكن التدليل عليه رقميًا، لكن باستخدام Analytics غير متاحة للعوام اللي زينا، وتكلفة الحصول عليها عالية.

* كل اللي فات ده ممكن يسلط الضوء على العامل النفسي كمان، هل كثرة التسديدات الصعبة بيأثر على اللاعب لما تجيله فرصة سهلة؟ هل بيحبطه؟ هل كونه بيسجل في النهاية بعد كل التسديدات الصعبة دي يدل على تركيزه وإنه ما بيفقدش الأمل وبيفضل يحاول حتى لو نظريًا الوضع يائس؟

في النهاية، كل دي مجرد “مؤشرات”، وظيفتها نادرًا ما بتكون القطع أو الحسم إلا في حالات نادرة متطرفة بيتكرر فيها نمط معين بوضوح، أو فيها فرق رقمي ضخم لا يمكن تفسيره بظروف المباراة أو صعوبتها او غيره.

الخلاصة اللي بيقولها داريل هاف في كتابه عشان تتغلب على كل المستنقعات والأفخاخ دي، إنك لازم تشكك في أي إحصائية أو دراسة معروضة عليك، مش تشكيك لغرض التشكيك، لكن لازم تسأل لو فيها حاجة مش واضحة، أو لو ما فهمتش طريقة حسابها، أو لو حسيت إن مقدم الإحصائية أو الدراسة متعمد يخبي معلومة معينة عشان يصنع سردية مش موضوعية أو حقيقية، تقديم الإحصائيات مجردة كده باعتبارها أرقام والأرقام لا تكذب ده ما هو إلا محاولة لإكساب رأي معين حصانة من النقد.

السبب هو إن الأرقام ما بتكذبش فعلًا، بس الأرقام دي لم توجد من العدم، بيصنعها بشر والبشر دول بيكذبوا عادي، والبديل عمره ما حيكون الإكتفاء بعينيك، لأن إنت كمان بتكذب، وعينيك بتكذب عليك، وعقلك بيكذب عليكم إنتو الإتنين، وذاكرتك ما تقدرش تخزن ربع المعلومات دي، ولا ذاكرة المدرب ولا محلل الأداء ولا اللاعب نفسه، والخناقة دي مفتعلة لأنه مفيش خيار مطروح بين إنك تتفرج بس أو تتابع الإحصائيات بس، ممكن تعمل الإتنين عادي وتطلع بتصور أفضل وأشمل عن اللي حصل، حتى لو ماكانش مثالي.

المصدر