تضامنًا مع حق الشعب الفلسطيني |
مفارقة سمبسون
مفارقة سمبسون |
مفارقة سيمبسون ويشار إليها أيضًا باسم انعكاس سيمبسون، أو تأثير ياول-سيمبسون، أو مفارقة الاندماج، أو مفارقة الانعكاس.[1] هي ظاهرة في الاحتمالات والإحصاءات، يظهر فيها اتجاه في عدة مجموعات مختلفة من البيانات ولكنه يختفي أو ينعكس عندما يتم دمج هذه المجموعات. غالبًا ما تُصادف هذه النتيجة في إحصاءات العلوم الاجتماعية والعلوم الطبية [2] [3] [4] وتكون إشكالية بشكل خاص عندما يتم إعطاء بيانات التكرار تفسيرات سببية لا داعي لها.[5] يمكن حل المفارقة عند معالجة العلاقات السببية بشكل مناسب في النمذجة الإحصائية.[6]
تم استخدام مفارقة سيمبسون كمثال مثالي للتوضيح للجمهور غير المتخصص أو العام النتائج المضللة التي يمكن أن تولدها الإحصائيات الخاطئة.[7] كتب مارتن غاردنر رواية شائعة لمفارقة سيمبسون في عمود الألعاب الرياضية في مجلة ساينتفك أمريكان في مارس عام 1976.[8]
كان إدوارد إتش سيمبسون أول من وصف هذه الظاهرة في ورقة فنية عام 1951، [9] لكن الإحصائيين كارل بيرسون في عام 1899، [10] وأودني يول في عام 1903، [11] ذكروا آثارًا مماثلة في وقت سابق. قدم كولين آر بليث اسم مفارقة سمبسون في عام 1972.[12]
أمثلة
التحيز الجنسي لجامعة كاليفورنيا في بركلي
واحدة من أشهر الأمثلة على مفارقة سيمبسون هي دراسة التحيز بين الجنسين بين المتقدمين للدراسات العليا في جامعة كاليفورنيا، بركلي. حيث أظهرت أرقام القبول لخريف عام 1973 أن الرجال المتقدمين كانوا أكثر قبولاً من النساء، وكان الفرق كبيرًا لدرجة أنه من غير المحتمل أن يكون بسبب الصدفة.[13]
رجال | نساء | |||
---|---|---|---|---|
المتقدمين | المقبولين | المتقدمات | المقبولات | |
المجموع | 8442 | 44٪ | 4321 | 35٪ |
ومع ذلك، عند فحص الأقسام الفردية، بدا أن ست من أصل 85 إدارة كانت متحيزة بشكل كبير ضد الرجال، في حين كانت أربع إدارات متحيزة بشكل كبير ضد النساء. في الواقع، أظهرت البيانات المجمعة والمصححة «تحيزًا صغيرًا ولكن مهمًا إحصائيًا لصالح النساء». [13] البيانات من أكبر ست إدارات مدرجة أدناه، أعلى قسمين حسب عدد المتقدمين لكل جنس مائل.
القسم | رجال | نساء | ||
---|---|---|---|---|
المتقدمين | المقبولين | المتقدمات | المقبولات | |
أ | 825 | 62٪ | 108 | 82٪ |
ب | 560 | 63٪ | 25 | 68٪ |
ج | 325 | 37٪ | 593 | 34٪ |
د | 417 | 33٪ | 375 | 35٪ |
هـ | 191 | 28٪ | 393 | 24٪ |
و | 373 | 6٪ | 341 | 7٪ |
ورقة البحث التي كتبها بيكل وآخرون. [13] خلصت إلى أن النساء يميلون إلى التقدم إلى الإدارات التنافسية ذات معدلات القبول المنخفضة حتى بين المتقدمين المؤهلين (كما هو الحال في قسم اللغة الإنجليزية)، بينما يميل الرجال إلى التقدم إلى الإدارات الأقل تنافسية مع معدلات قبول عالية بين المتقدمين المؤهلين (مثل الهندسة والكيمياء).
علاج حصوات الكلى
هذا مثال واقعي من دراسة طبية [14] تقارن بين معدلات النجاح لعلاجين لحصوات الكلى.[15]
يوضح الجدول أدناه معدلات النجاح للعلاجات التي تشمل حصوات الكلى الصغيرة والكبيرة، حيث يشمل العلاج أ جميع العمليات الجراحية المفتوحة والعلاج ب هو بضع حصاة الكلى عن طريق الجلد (التي تنطوي على ثقب صغير فقط). تشير الأرقام بين قوسين إلى عدد حالات النجاح على الحجم الإجمالي للمجموعة.
العلاج أ | العلاج ب | |
---|---|---|
الحصوات الصغيرة | مجموعة 1 93٪ (81/87) |
مجموعة 2 87٪ (234/270) |
الحصوات الكبيرة | مجموعة3
73٪ (192/263) |
مجموعة 4 69٪ (55/80) |
كلاهما | 78٪ (273/350) | 83٪ (289/350) |
الاستنتاج المتناقض هو أن العلاج أ يكون أكثر فعالية عند استخدامه على الحصوات الصغيرة، وكذلك عند استخدامه على الحصوات الكبيرة، ولكن العلاج ب يكون أكثر فعالية عند النظر في كلا الحجمين في نفس الوقت. في هذا المثال، المتغير «الكامن» (أو المتغير المربك) هو شدة الحالة (ممثلة في اتجاه قرار العلاج من قبل الأطباء بتفضيل ب في الحالات الأقل شدة)، والتي لم تكن معروفة في السابق بأنها مهمة حتى تم تضمين آثارها.
يتم تحديد العلاج الذي يعتبر الأفضل من خلال عدم المساواة بين نسبتين (النجاحات/الإجمالي). يحدث عكس التفاوت بين النسب، مما يخلق مفارقة سمبسون، لأن هناك تأثيران يحدثان معًا:
- تختلف أحجام المجموعات، التي يتم دمجها عند تجاهل المتغير الكامن، اختلافًا كبيرًا. يميل الأطباء إلى إعطاء الحالات الشديدة (الحصوات الكبيرة) علاجًا أفضل (أ)، والحالات الأخف (الحصوات الصغيرة) العلاج الأدنى (ب). لذلك، تهيمن المجموعتان 3 و 2 على المجموعتين، وليس على المجموعتين الأصغر بكثير 1 و 4.
- المتغير الكامن له تأثير كبير على النسب؛ أي أن معدل النجاح يتأثر بشدة الحالة أكثر من اختيار العلاج. لذلك، فإن مجموعة المرضى الذين يعانون من حصوات كبيرة باستخدام العلاج أ (المجموعة 3) تكون أسوأ من المجموعة ذات الحصوات الصغيرة (المجموعتان 1 و 2)، حتى لو استخدمت الأخيرة العلاج الأدنى ب (المجموعة 2).
بناءً على هذه الآثار، يُنظر إلى النتيجة المتناقضة على أنها تنشأ من خلال قمع التأثير السببي لشدة الحالة على العلاج الناجح. يمكن إعادة صياغة النتيجة المتناقضة بدقة أكبر على النحو التالي: عندما يتم تطبيق العلاج الأقل فعالية (ب) بشكل متكرر على الحالات الأقل شدة، يمكن أن يبدو أنه علاج أكثر فعالية.
متوسطات عدد الضربات
مثال شائع على مفارقة سيمبسون ينطوي على متوسطات الضرب للاعبي البيسبول المحترفين. من الممكن أن يكون لدى لاعب واحد معدل ضربات أعلى من لاعب آخر كل عام لعدد من السنوات، ولكن يكون متوسط الضرب أقل طوال كل تلك السنوات. يمكن أن تحدث هذه الظاهرة عندما تكون هناك اختلافات كبيرة في عدد مرات ضربات الكرة بين السنوات. أظهر عالم الرياضيات كين روس [16] هذا باستخدام متوسط ضربات لاعبي البيسبول، ديريك جيتر وديفيد جاستس، خلال عامي 1995 و 1996:[17]
1995 | 1996 | كلاهما | ||||
---|---|---|---|---|---|---|
ديريك جيتر | 12/48 | 250. | 183/582 | 314. | 195/630 | 310. |
ديفيد جاستس | 104/411 | 253. | 45/140 | 321. | 149/551 | 270. |
في كل من 1995 و 1996، كان لجاستس معدل ضربات أعلى (بخط غامق) من جيتر. ومع ذلك، عندما يتم الجمع بين موسمي البيسبول، يظهر جيتر متوسط ضرب أعلى من جاستس. وفقًا لروس، ستتم ملاحظة هذه الظاهرة مرة واحدة سنويًا بين أزواج اللاعبين المحتملين.
التفاوت العنصري في عقوبة الإعدام
هذا المثال الواقعي مأخوذ من راديليت.[18] البيانات من عشرين مقاطعة في فلوريدا خلال 1976-1977.
Defendant Victim
|
أبيض | أسود | كلاهما |
---|---|---|---|
أبيض | 13٪ (19/151) | 17٪ (11/63) | 14٪ (30/214) |
أسود | 0٪ (0/9) | 6٪ (6/103) | 5٪ (6/112) |
كلاهما | 12٪ (19/160) | 10٪ (17/166) |
عند تصنيف البيانات حسب جنس الضحية، يبدو أن المتهمين السود أكثر عرضة للحكم عليهم بالإعدام. ومع ذلك، نظرًا لأن معظم الضحايا من البيض، فإن الجرائم ضد الضحايا البيض لديها معدلات أحكام أعلى، ومعظم الجرائم ضد الضحايا البيض تم ارتكابها من قبل المتهمين البيض، تشير البيانات الإجمالية إلى أن المتهمين البيض أكثرعرضة للحكم عليهم بالإعدام.
تفسير المتجهات
يمكن أيضًا توضيح مفارقة سيمبسون باستخدام الفضاء المتجهي ثنائي الأبعاد.[19] معدل نجاح (أي النجاحات / المحاولات) يمكن تمثيلها بمتجة ، مع ميل . يمثل المتجه الحاد معدل نجاح أكبر. إذا معدلات اثنين و يتم دمجها، كما في الأمثلة الواردة أعلاه، يمكن تمثيل النتيجة بمجموع المتجهات و ، والتي وفقًا لقاعدة متوازي الأضلاع هي المتجه ، مع ميل .
تقول مفارقة سيمبسون أنه حتى لو كان متجهاً (باللون البرتقالي في الشكل) لديه ميل أصغر من متجة آخر (باللون الأزرق)، و لديه ميل أصغر من مجموع المتجهين من المحتمل أن يكون هناك ميل أكبر من مجموع المتجهين ، كما هو موضح في المثال. ولكي يحدث هذا، يجب أن يكون لأحد المتجهات البرتقالية ميل أكبر من أحد المتجهات الزرقاء (هنا & )، وستكون هذه بشكل عام أطول من المتجهات المشتركة البديلة وبالتالي تهيمن على المقارنة الإجمالية.
العلاقة بين المتغيرات
يمكن أن تنشأ مفارقة سيمبسون أيضًا في الارتباطات، حيث يبدو أن متغيرين لهما (على سبيل المثال) ارتباط إيجابي تجاه بعضهما البعض، في حين أنهما في الواقع لديهم علاقة سلبية. برمان [20] أعط مثالا من الاقتصاد، حيث تشير مجموعة البيانات إلى أن الطلب الإجمالي مرتبط بشكل إيجابي بالسعر (أي أن الأسعار المرتفعة تؤدي إلى المزيد من الطلب)، في تناقض مع التوقعات. يكشف التحليل أن الوقت هو المتغير المربك: إن رسم كل من السعر والطلب مقابل الوقت يكشف عن الارتباط السلبي المتوقع على مدار فترات مختلفة، والذي ينعكس بعد ذلك ليصبح إيجابيًا إذا تم تجاهل تأثير الوقت بمجرد تخطيط الطلب مقابل السعر.
الآثار المترتبة على صنع القرار
الأهمية العملية لمفارقة سيمبسون في حالات صنع القرار حيث تطرح المعضلة التالية: ما هي البيانات التي يجب أن نستشيرها عندما نتصرف، مجمع أو مقسم؟ في مثال حصوات الكلى أعلاه، من الواضح أنه إذا تم تشخيص المرء بـ «الحصوات الصغيرة» أو «الحصوات الكبيرة» فيجب استشارة البيانات الخاصة بالسكان الفرعيين المعنيين والعلاج أ يفضل للعلاج ب. ولكن ماذا لو لم يتم تشخيص المريض، وحجم الحصوة غير معروف؛ هل سيكون من المناسب استشارة البيانات المجمعة وإدارة العلاج ب؟ وهذا من شأنه أن يتعارض مع الفطرة السليمة؛ يجب أيضًا تفضيل العلاج المفضل في ظل حالة واحدة وتحت نفيه عندما تكون الحالة غير معروفة.
من ناحية أخرى، إذا كانت البيانات المقسمة يفضل أن يكون بداهة، ما يمنع أحد من تقسيم البيانات إلى فئات فرعية تعسفية (ويقول على أساس لون العين أو الألم بعد العلاج) التي شيدت بشكل مصطنع لانتاج الخيارات الخاطئة من العلاجات؟ يُظهر بيرل [5] أنه في كثير من الحالات، تكون البيانات المجمعة، وليس المقسمة، هي التي تعطي الاختيار الصحيح للعمل. الأسوأ من ذلك، بالنظر إلى نفس الجدول، يجب على المرء في بعض الأحيان اتباع البيانات المقسمة وأحيانًا البيانات المجمعة، اعتمادًا على القصة وراء البيانات، مع كل قصة تملي اختيارها الخاص. يعتبر بيرل أن هذا هو المفارقة الحقيقية وراء انعكاس سيمبسون.
أما لماذا وكيف يجب أن تملي القصة، وليس البيانات، الخيارات، فإن الإجابة هي أن القصة هي التي ترمز العلاقات السببية بين المتغيرات. بمجرد توضيح هذه العلاقات وتمثيلها رسميًا، يمكننا اختبار القسم الذي يعطي الأفضلية في العلاج. على سبيل المثال، إذا قمنا بتمثيل العلاقات السببية في رسم بياني يسمى «مخطط السببية» (انظر شبكات بايزي)، فيمكننا اختبار ما إذا كانت العقد التي تمثل المسارات الهامشية للاعتراض على التقسيم المقترح في الرسم التخطيطي. هذا الاختبار، الذي يسمى «معيار الباب الخلفي»، يقلل مفارقة سيمبسون إلى تمرين في نظرية الرسم البياني.[21]
علم النفس
يسعى الاهتمام النفسي بمفارقة سمبسون إلى تفسير سبب اعتبار الناس أن الانعكاس على التوقيع مستحيل في البداية، مستاء من فكرة أن العمل المفضل في ظل شرط واحد وتحت نفيه يجب رفضه عندما يكون الشرط غير معروف. السؤال هو من أين يحصل الناس على هذا الحدس القوي، وكيف يتم تشفيره في العقل.
توضح مفارقة سيمبسون أن هذا الحدس لا يمكن اشتقاقه من المنطق الكلاسيكي أو حساب الاحتمالات وحده، وبالتالي دفع الفلاسفة إلى التكهن بأنه مدعوم بمنطق سببي فطري يوجه الناس في التفكير في الإجراءات وعواقبها[بحاجة لمصدر] . إن مبدأ الشيء المؤكد لسافاج [12] هو مثال لما قد يستتبعه هذا المنطق. يمكن بالفعل الحصول على نسخة مؤهلة من مبدأ الشيء المؤكد لسافاج من حساب بيرل دو-كالكولوس [5] ويقرأ: "الإجراء A الذي يزيد من احتمال وقوع حدث B في كل مجموعة سكانية C i من C يجب أيضًا أن يزيد من احتمال B في السكان ككل، شريطة أن لا يغير العمل توزيع المجموعات السكانية الفرعية ". هذا يشير إلى أن المعرفة حول الإجراءات والعواقب يتم تخزينها في شكل يشبه شبكة بايزية سببية.
احتمال
ورقة كتبها بافليديس وبيرلمان تقدم دليلا، وذلك بسبب هاجيكوستاس، أنه في جدول عشوائي 2 × 2 × 2 مع توزيع موحد، سوف يحدث تناقض سمبسون مع احتمال بالضبط 1/60. [22] تشير دراسة أجراها كوك إلى أن احتمال حدوث مفارقة سيمبسون بشكل عشوائي في نماذج المسار (أي النماذج التي تم إنشاؤها بواسطة تحليل المسار) مع اثنين من المتنبئات ومتغير معياري واحد هو حوالي 12.8 في المائة؛ أعلى بقليل من حدوث واحد لكل 8 نماذج مسار.[23]
مفارقة سمبسون الثانية
تمت مناقشة مفارقة ثانية لسيمبسون أقل شهرة في بحثه لعام 1951. يمكن أن تحدث عندما لا يلزم العثور على التفسير العقلاني في الجدول المنفصل ولكن قد يتواجد بدلاً من ذلك في الجدول المدمج. أي نوع من البيانات يجب استخدامه يتوقف على الخلفية والعملية التي تؤدي إلى البيانات.
يعطي نورتون وديفاين مثالًا افتراضيًا للمفارقة الثانية.[24]
مراجع
- ^ آي. جيه. غود, Y. Mittal (يونيو 1987). "The Amalgamation and Geometry of Two-by-Two Contingency Tables". The Annals of Statistics. ج. 15 ع. 2: 694–711. DOI:10.1214/aos/1176350369. ISSN:0090-5364. JSTOR:2241334.
- ^ Clifford H. Wagner (فبراير 1982). "Simpson's Paradox in Real Life". ذا أمريكان ستاتيستيشين. ج. 36 ع. 1: 46–48. DOI:10.2307/2684093. JSTOR:2684093.
- ^ Holt, G. B. (2016). Potential Simpson's paradox in multicenter study of intraperitoneal chemotherapy for ovarian cancer. Journal of Clinical Oncology, 34(9), 1016-1016. نسخة محفوظة 2016-03-23 على موقع واي باك مشين.
- ^ Franks، Alexander؛ Airoldi، Edoardo؛ Slavov، Nikolai (2017). "Post-transcriptional regulation across human tissues". PLOS Computational Biology. ج. 13 ع. 5: e1005535. arXiv:1506.00219. DOI:10.1371/journal.pcbi.1005535. ISSN:1553-7358. PMID:28481885.
{{استشهاد بدورية محكمة}}
: الوسيط غير المعروف|PMCID=
تم تجاهله يقترح استخدام|pmc=
(مساعدة) - ^ أ ب ت Judea Pearl. Causality: Models, Reasoning, and Inference, Cambridge University Press (2000, 2nd edition 2009). (ردمك 0-521-77362-8).
- ^ Kock, N., & Gaskins, L. (2016). Simpson's paradox, moderation and the emergence of quadratic relationships in path models: An information systems illustration. International Journal of Applied Nonlinear Science, 2(3), 200-234. نسخة محفوظة 2019-11-26 على موقع واي باك مشين.
- ^ Robert L. Wardrop (February 1995). "Simpson's Paradox and the Hot Hand in Basketball". The American Statistician, 49 (1): pp. 24–28.
- ^ Gardener، Martin (مارس 1979). "MATHEMATICAL GAMES: On the fabric of inductive logic, and some probability paradoxes" (PDF). Scientific American. ج. 234 ع. 3: 119. DOI:10.1038/scientificamerican0376-119. مؤرشف من الأصل (PDF) في 2017-02-28. اطلع عليه بتاريخ 2017-02-28.
- ^ Simpson, Edward H. (1951). "The Interpretation of Interaction in Contingency Tables". Journal of the Royal Statistical Society, Series B. ج. 13: 238–241.
- ^ Pearson، Karl؛ Lee، Alice؛ Bramley-Moore، Lesley (1899). "Genetic (reproductive) selection: Inheritance of fertility in man, and of fecundity in thoroughbred racehorses". Philosophical Transactions of the Royal Society A. ج. 192: 257–330. DOI:10.1098/rsta.1899.0006.
- ^ G. U. Yule (1903). "Notes on the Theory of Association of Attributes in Statistics". Biometrika. ج. 2 ع. 2: 121–134. DOI:10.1093/biomet/2.2.121. مؤرشف من الأصل في 2019-11-10.
- ^ أ ب Colin R. Blyth (يونيو 1972). "On Simpson's Paradox and the Sure-Thing Principle". Journal of the American Statistical Association. ج. 67 ع. 338: 364–366. DOI:10.2307/2284382. JSTOR:2284382.
- ^ أ ب ت P.J. Bickel, E.A. Hammel and J.W. O'Connell (1975). "Sex Bias in Graduate Admissions: Data From Berkeley" (PDF). Science. ج. 187 ع. 4175: 398–404. DOI:10.1126/science.187.4175.398. PMID:17835295. مؤرشف من الأصل (PDF) في 2020-06-29.
- ^ C. R. Charig؛ D. R. Webb؛ S. R. Payne؛ J. E. Wickham (29 مارس 1986). "Comparison of treatment of renal calculi by open surgery, percutaneous nephrolithotomy, and extracorporeal shockwave lithotripsy". المجلة الطبية البريطانية. ج. 292 ع. 6524: 879–882. DOI:10.1136/bmj.292.6524.879. PMID:3083922.
{{استشهاد بدورية محكمة}}
: الوسيط غير المعروف|PMCID=
تم تجاهله يقترح استخدام|pmc=
(مساعدة) - ^ Steven A. Julious؛ Mark A. Mullee (3 ديسمبر 1994). "Confounding and Simpson's paradox". المجلة الطبية البريطانية. ج. 309 ع. 6967: 1480–1481. DOI:10.1136/bmj.309.6967.1480. PMID:7804052. مؤرشف من الأصل في 2006-07-12.
{{استشهاد بدورية محكمة}}
: الوسيط غير المعروف|PMCID=
تم تجاهله يقترح استخدام|pmc=
(مساعدة) - ^ Ken Ross. "A Mathematician at the Ballpark: Odds and Probabilities for Baseball Fans (Paperback)" Pi Press, 2004. (ردمك 0-13-147990-3). 12–13
- ^ Statistics available from Baseball-Reference.com: Data for Derek Jeter؛ Data for David Justice. نسخة محفوظة 2009-02-28 على موقع واي باك مشين.
- ^ Michael Radelet (1981). "Racial Characteristics and the Imposition of the Death Penalty". American Sociological Review. ج. 46 ع. 6: 918–927. مؤرشف من الأصل في 2020-06-07.
- ^ Kocik Jerzy (2001). "Proofs without Words: Simpson's Paradox" (PDF). مجلة الرياضيات. ج. 74 ع. 5: 399. DOI:10.2307/2691038. JSTOR:2691038. مؤرشف من الأصل (PDF) في 2012-03-24. اطلع عليه بتاريخ أكتوبر 2020.
{{استشهاد بدورية محكمة}}
: تحقق من التاريخ في:|تاريخ الوصول=
(مساعدة) - ^ Berman, S. DalleMule, L. Greene, M., Lucker, J. (2012), "Simpson’s Paradox: A Cautionary Tale in Advanced Analytics", Significance. نسخة محفوظة 2020-05-10 على موقع واي باك مشين.
- ^ Pearl، Judea (ديسمبر 2013). "Understanding Simpson's paradox" (PDF). UCLA Cognitive Systems Laboratory, Technical Report R-414. مؤرشف من الأصل (PDF) في 2019-11-22.
- ^
Marios G. Pavlides؛ Michael D. Perlman (أغسطس 2009). "How Likely is Simpson's Paradox?". ذا أمريكان ستاتيستيشين. ج. 63 ع. 3: 226–233. DOI:10.1198/tast.2009.09007. مؤرشف من الأصل في 2020-07-04.
{{استشهاد بدورية محكمة}}
: الوسيط غير المعروف|last-author-amp=
تم تجاهله يقترح استخدام|name-list-style=
(مساعدة) - ^ Kock, N. (2015). How likely is Simpson’s paradox in path models? International Journal of e-Collaboration, 11(1), 1–7. نسخة محفوظة 2018-08-20 على موقع واي باك مشين.
- ^ Norton، H. James؛ Divine، George (أغسطس 2015). "Simpson's paradox … and how to avoid it". Significance. ج. 12 ع. 4: 40–43. DOI:10.1111/j.1740-9713.2015.00844.x.
فهرس
- ليلى شنيبس وكورالي كولمز، الرياضيات تحت المحاكمة. كيف يتم استخدام الأرقام وإساءة استخدامها في قاعة المحكمة،Basic Books 2013. (ردمك 978-0-465-03292-1) رقم ISBN 978-0-465-03292-1 . (الفصل السادس: «خطأ الرياضيات رقم 6: مفارقة سمبسون. قضية التحيز الجنسي في بيركلي: كشف التمييز»).
روابط خارجية
- هل كان المصوتون الأكثر ثراء أكثر ترجيحًا للتصويت على ترامب؟ (مفارقة سمبسون) - فيديو يوتيوب يشرح مفارقة سمبسون.
- كيف يمكن للإحصاءات أن تكون مضللة - مارك ليدل - فيديو TED-Ed ودرس.
- موسوعة ستانفورد للفلسفة: " مفارقة سمبسون " - بقلم غاري ماليناس.
- أقدم استخدامات معروفة لبعض كلمات الرياضيات: S
- للحصول على تاريخ موجز لأصول المفارقة، راجع إدخالات «مفارقة سمبسون» و «ارتباط زائف»
- بيرل ، يهودا، " " فن وعلم السبب والنتيجة. " عرض شرائح ومحاضرة تعليمية.
- بيرل ، يهودا، «مفارقة سمبسون: تشريح» (PDF)
- بيرل ، يهودا، «مبدأ الشيء المؤكد» (PDF)
- مقالات قصيرة ألكسندر بوجومولني في Cut the the knot:
- " الكسور المتوسطة " .
- " مفارقة سمبسون " .
- تعامل عمود صحيفة وول ستريت جورنال "The Numbers Guy" في 2 ديسمبر 2009 مع الحالات الأخيرة لمفارقة سمبسون في الأخبار. ولا سيما مفارقة سيمبسون في مقارنة معدلات البطالة في ركود عام 2009 مع ركود عام 1983.
- كيفية حل مفارقة سمبسون؟ سؤال عن إحصائيات موقع سؤال وجواب CrossValidated
- على اللوحة، اللغز الإحصائي: فهم مفارقة سمبسون بقلم آرثر سميث، 20 أغسطس 2010
- Reich، Henry. "Simpson's Paradox". YouTube. MinutePhysics. مؤرشف من الأصل (video) في 2020-07-02. اطلع عليه بتاريخ 2017-10-24.
مفارقة سمبسون في المشاريع الشقيقة: | |