تحيزات خفية في خوارزميات التوظيف: دراسة تكشف فجوات في العدالة عند تفكيك البيانات

أظهرت دراسة جديدة أن أدوات الذكاء الاصطناعي المستخدمة في فرز طلبات التوظيف، رغم ظهورها بمظهر محايد عند النظر إلى النتائج الإجمالية، تكشف عن أنماط تحيز واضحة عند فحص كل وظيفة على حدة. حلل الباحثون بيانات أكثر من 4.1 مليون طلب توظيف قدمها نحو 3.37 مليون شخص إلى 1746 وظيفة لدى 156 جهة عمل،

وجميعها استخدمت أدوات تقييم طورتها شركة واحدة.اختبارات قائمة على الألعاببعد التقدم للوظيفة، يخضع المرشحون لاختبارات تعتمد على الألعاب، تهدف إلى قياس صفات مثل التركيز وتحمّل المخاطر والسلوك الاجتماعي. بناءً على أداء المتقدم،

تصنف الخوارزمية الطلب ضمن فئتين: "موصى به" أو "غير موصى به"، وتستخدم الشركات هذه النتيجة لتحديد من ينتقل إلى المقابلة أو المرحلة التالية، مما قد يؤدي إلى استبعاد بعض الطلبات قبل المراجعة البشرية.صورة مختلفة عند تفكيك البياناتاستخدم الباحثون معيار "الأربعة أخماس" المعتمد في الولايات المتحدة لرصد الأثر المحتمل للتمييز. يشير هذا المعيار إلى وجود علامة تحذير عندما تقل نسبة اختيار مجموعة معينة عن 80% من نسبة المجموعة الأعلى اختياراً.

عند تحليل جميع الطلبات إجمالاً، لم تظهر النتائج مستوى واضحاً من التحيز يستدعي القلق، لكن الصورة تغيرت عند فحص كل وظيفة على حدة. فقد وجد أن 14.74% من طلبات المتقدمين الآسيويين،

و25.87% من طلبات المتقدمين من ذوي البشرة الداكنة، قدمت إلى وظائف أظهرت فيها الخوارزمية أثراً سلبياً على مجموعتهم. كما سجلت 10.62% من الوظائف أثراً سلبياً ضد المتقدمين من ذوي البشرة الداكنة، وقدر الباحثون أنه لو كانت معدلات التوصية متساوية،

لحصل نحو 40 ألف طلب إضافي من هذه المجموعات على توصية بالانتقال إلى المرحلة التالية.لا حاجة لبيانات عرقية مباشرةتثير النتائج أسئلة حول الاعتقاد بأن الخوارزميات تصبح محايدة بمجرد حذف الاسم أو العرق أو غيره من البيانات الحساسة. فالاختبارات لا تعتمد صراحة على المعلومات الديموغرافية، والشركة المطورة تقول إنها صممت النماذج لتقليل الأثر غير المتوازن أثناء التدريب. ومع ذلك،

توصل الباحثون إلى أن التفاوت يمكن أن يظهر من خلال متغيرات أخرى ترتبط بشكل غير مباشر بخلفية المتقدم، وهو ما يعرف بالتمييز عبر المؤشرات البديلة، حيث تتعلم الخوارزمية أنماطاً تبدو محايدة لكنها ترتبط عملياً بخصائص اجتماعية أو ديموغرافية.الثقافة الخوارزمية الواحدةلا تقتصر المشكلة على أداء خوارزمية داخل شركة واحدة، بل إن اعتماد جهات عديدة على المورد نفسه قد يجعل قرارات الرفض متشابهة عبر سوق العمل.

يطلق الباحثون على هذه الحالة اسم "الثقافة الخوارزمية الواحدة"، حيث يعتمد عدد كبير من أصحاب القرار على النماذج نفسها أو على أنظمة متقاربة. وجدت الدراسة أن 4% من الأشخاص الذين تقدموا إلى 10 وظائف خضعت لهذه الاختبارات حصلوا على نتيجة "غير موصى به" في الوظائف العشر كلها، وهي نسبة أعلى مما كان متوقعاً لو اتخذت كل شركة قرارها بشكل مستقل.

يعني ذلك أن المرشح الذي لا يناسب النمط الذي يفضله أحد النماذج قد يواجه الرفض مراراً لدى مؤسسات مختلفة، حتى عندما تتنوع الوظائف والشركات.التقديم الواسع قد لا يحل المشكلةاستخدم الباحثون قابلية الخوارزميات لتكرار النتائج لمحاكاة ما قد يحدث لو تقدم المرشحون إلى عدد أكبر من الوظائف. أظهرت المحاكاة أن كل متقدم تقريباً يمكن أن يحصل على توصية في وظيفة واحدة على الأقل إذا تقدم إلى جميع الوظائف المتاحة، لكن هذا السيناريو غير واقعي.

حسب الدراسة، يحتاج الشخص إلى التقدم إلى نحو 25 وظيفة لتقليل احتمال الرفض الشامل إلى أقل من 0.1%، مقارنة بعشر وظائف فقط إذا كانت القرارات مستقلة تماماً.التدقيق على مستوى كل وظيفةتوضح النتائج أن قياس العدالة على مستوى ملايين الطلبات مجتمعة قد يخفي تفاوتات مهمة في وظائف بعينها. لذلك يدعو الباحثون إلى تحليل النتائج بشكل مفصل حسب الوظيفة والمجموعة،

بدلاً من الاعتماد على متوسط عام يعطي انطباعاً بالحياد. كما يطالبون بمزيد من الشفافية وإتاحة البيانات للباحثين المستقلين، لأن معظم أنظمة التوظيف تعمل داخل بيئات مغلقة يصعب فحصها. لا تثبت الدراسة أن جميع أدوات التوظيف المعتمدة على الذكاء الاصطناعي متحيزة،

لكنها تشير إلى أن استخدام الخوارزمية على نطاق واسع لا يضمن العدالة تلقائياً، وأن نظاماً واحداً قد يؤثر في فرص آلاف المتقدمين عبر شركات متعددة من دون أن يظهر ذلك بوضوح في التقارير الإجمالية. اعتماد شركات متعددة على الأداة نفسها قد يؤدي إلى تكرار أنماط الرفض عبر سوق العمل (غيتي) حللت الدراسة أكثر من 4.1 مليون طلب توظيف قُدمت إلى 1746 وظيفة لدى 156 جهة عمل (غيتي)

أضف تعليقاً