من ضمن الحاجات المفيدة للمهيصة بتاعة ال LLMs هتطلع الذكاء الصناعي الخارق و تحل محل الإنسان لو أديناه سيرفرات كفاية دي إنها خلت كتير قوي من علماء الذكاء الصناعي ينزلوا يشرحوا بالتفصيل ليه ده مش هيحصل، و في إطار الشرح ده بتلاقي إن كل واحد فيهم بيوصف بشيء من التفصيل قدرة من قدرات الإنسان اللي إحنا بناخدها علي إنها مسلم بيه لدرجة إننا مش شايفينها و بيشرح هو كان بيحاول يخلي الكمبيوتر يحققها إزاي و إزاي بتوع ال LLMs أصلاً مش باصين علي النقطة دي من بابه.
من كام يوم ظهرت قدامي علي تويتر مقتطفات من لقاء لواحد إسمه جودايا بيرل، واحد من الدولة الزرقاء حائز علي جائزة تورينج – اللي هي زي جائزة نوبل في البرمجة – مع مذيع إسمه سام هاريس. أنا فاكر إن الإسم ده كان محل إنتقاد عنيف من سلافوي جيجك تقريباً بسبب إنه كان بيأيد التعذيب الأمريكي اللي كان بيتم في معسكرات الإعتقال، بس فاكر طشاش يعني مش متأكد، بس يعني الموضوع واصل لإن سلافوي جيجك كان بيقول بسخرية إنه بيأيد عقوبة الإعدام علشان سام هاريس علي قيد الحياة !
دورت عليه شوية لقيته يميني ميتقعلش من الرجل، دورت علي الفيديو و فعلاً اللقاء كان زبالة في معظمه، تلميع للي ما يتسموا في جزء كبير منه.
بس في السكة جودايا بيرل شرح بسرعة ليه من وجهة نظره ال LLMs تضييع وقت و مجهود. قعدت دورت وراه و ورا أبحاثه علشان أفهم وجهة نظره لأنه قالها في دقيقة بسرعة.
أحد أساسيات الإحصاء هي فكرة إن الارتباط لا يعني السببية correlation does not mean causation. يعني علي سبيل المثال معظم اللي ماتوا في الحرب العالمية الثانية كان مقاس جزمتهم 43. هي معني كده إن مقاس جزمتك يبقي عامل في تحديد مصيرك في الحرب؟ هنا في إرتباط بين رقمين إحصائيين: مقاس الجزمة و نسبة الوفاة، بس كون إن الرقمين مرتبطين ده مش معناه إن واحد فيهم بيسبب التاني.
مثال حقيقي بقي من الحياة عن الخناقة بين الإرتباط و السببية: فيه عالم مشهور قوي في عالم الميكروبات إسمه روبرت كوخ، هو إشتهر بإنه إكتشف الباكتيريا المسببة للسل و الكوليرا و الجمرة الخبيثة، بس أهم إضافة ليه هو أسلوب إثباته إن ميكروب كذا بيسبب مرض كذا.
كوخ مكانش شايف إنه كفاية إني ألاقي الميكروب الفلاني في الحيوان المريض – اللي هو إرتباط – علشان أقول إنه الميكروب ده هو السبب في المرض. بالتالي هو طلع بشوية خطوات علشان يثبت إن ميكروب كذا بيسبب مرض كذا:
أول حاجة إنه يلاقي الميكروب في جسم الحيوان المريض، تاني حاجة إنه ياخد الميكروب يعزله في المعمل و يخليه ينمو في أطباق في المعمل، تالت حاجة إنه يحقنه في حيوان سليم و الحيوان السليم ده يصاب بالمرض.
الأسلوب ده فضل الأسلوب الرسمي لإثبات إن ميكروب ما بيسبب مرض ما لأكتر من مائة سنة.
بعدين ظهرت مشكلة في إنجلترا إن نسبة الأصابة بسرطان الرئة كانت عالية قوي، الناس كانوا شاكين في مليون حاجة من ضمنها الأسفلت اللي في الشوارع و التدخين كان عامل مهمل في القائمة. إتنين دكاترة درسوا الموضوع و فوجئوا بنسبة إرتباط رهيبة: تسعة من كل عشر مرضي سرطان رئة كانوا مدخنين. واحد من القائمين علي الدراسة كان مدخن، و وقف تدخين فوراً أول ما شاف الأرقام.
لما إترفعت قضايا علي شركات السجائر بتهمة إن المنتج بتاعها بيسبب سرطان المحاميين قالوا الإرتباط لا يعني السببية: كون إنك لقيت التدخين مرتبط بالسرطان مش معناه إن التدخين بيسبب سرطان، لو القطران اللي في السجائر بيحقق شروط روبرت كوخ يبقي تمام. طبعاً القطران مش ميكروب، مينفعش تزرعه في المعمل و مينفعش تعدي بيه مريض، هو مادة بتترسب في الرئة. المحكمة رفضت الحجة دي لحسن الحظ بس هي واحدة من أهم لحظات وقوف الإنسانية قدام فكرة correlation vs causation في رأيي.
علشان تحكم فعلاً إن الإرتباط يساوي السببية في حاجة معينة فأنت بتعمل تجارب زي تجارب كوخ أو يكون عندك رابط منطقي أنت عارفه بالتفكير و العلم و المنطق ( زي مثلاً إن القطران بيعمل كذا و كذا في خلايا الرئة يخلي معدل إنقسامها يزيد علشان تعالج نفسها، معدل الإنقسام الزيادة ده يزود نسبة الإصابة بالسرطان، الخ) أو الإتنين مع بعض.
الجزء التاني من الحوار ده إنك لما تعمل تجارب فده مش معناه مباشرة إنك تقدر تفسر النتائج: التدخل لا يعني التفسير intervention does not mean interpretation.
يعني إيه؟
يعني لو عملنا تجربة، اللي هي تدخل في سير الأمور العادي بالتالي بتتوصف بشكل عام إنها تدخل intervention، و إدينا شوية مرضي دواء معين و لقينا إن معظم اللي أخدوا الدواء خفوا، هل ده معناه إن الدواء ده بيعالج؟ لأ فيه ظوابط كتير منها مثلاً إن الناس بتتأثر نفسياً بإنها بتاخد علاج حتي لو مش شغال، فأنت لازم تعمل مجموعتين من الناس تدي شوية منهم الدواء و شوية تديهم دواء وهمي و تقارن النتائج.
أصلاً فيه أبحاث كتير بتتعمل كل شغلها إنها تمسك تجربة قديمة و تقول إن فهمنا لنتائجها مش سليم: التجربة مثلاً مختارتش ناس متوزعين علي نسب عمرية بشكل كويس، مختارتش ناس نمط حياتهم مختلف بما يكفي و نقت ناس فقراء أكثر عرضة لكذا ولا كذا، الخ.
جودايا بيرل كل شغله اللي أخد عليه جائزة تورينج كان إنه يخلي الذكاء الصناعي يدرس السببية correlation إنه يفهم فعلاً إن كذا بيسبب كذا بنسبة كذا في المائة، عن طريق حاجة إسمها bayesian networks. زي ما قولنا ال correlation ده الطبقة الأولي، التانية هي التفسير interpretation ، هو بيقول إنك لو إديت ل LLM بيانات تجربة و قولت له فسر لي اللي أنت شايفه ده يا نجم مش هيعرف لأن التفسير يشمل معرفة و منطق بموضوع التجربة و الحاجات اللي بتأثر فيها علشان تحكم علي النتائج اللي أنت شايفها. هو آخره يقول لك النتائج اللي الناس وصلت لها بالفعل في تفسير تجربة ما زمان، لإنه بيقرا اللي البشر عملوه بس هو ميعرفش يقلد البشر دول و يحكم علي نتائج جديدة مشافهاش قبل كده.
الكلام ده قد يبدو إن مكانه المعمل بس، بس يومياً البشر بيعملوا ملايين من عمليات فصل الإرتباط عن السببية، وكتير من علميات تفسير الحاجات اللي بيشوفوها، في حاجات يومية يعني. الأمثلة اللي أنا إديتها دي أمثلة قوية شويتين بس لتوضيح الفكرة.
و الصرف علي LLMs في رأي جودايا بيرل علشان تبقي زي الإنسان تضييع وقت و مجهود علشان هي محاولتش من بابه تطرق باب النقطة دي من قدرات الإنسان، اللي هو حاول يطرقها زمان يعني و أخد بسبب كده جائزة تورينج.
كل واحد من علماء الذكاء الصناعي اليومين دول بيطلع يشتغل بأسلوب كل يغني علي ليلاه، كل واحد بينتقد نقطة تركيزه هو اللي ال LLMs أهملتها و تسببت في إن كل الإنفاق راح بعيد عنها و في السكة الواحد بيتعلم كل يوم حاجة جديدة. جودايا بيرل مش أول واحد من بتوع الذكاء الصناعي يعمل كده يعني و لا أول واحد واخد جائزة تورينج يقول حاجة شبيهة – حتي الآن أنا أعرف تلاتة – فهو في الطابور يعني مع إخواته.