اعداد و شمار: آپ کتنے چیک کریں گے؟

اس صورتحال کا تصور کریں:

آپ نے اپنے ڈیٹا بیس کے لاکھوں صارفین پر ابھی ایک بیچ اپ ڈیٹ کیا ہے۔ کوئی غلطی کے پیغامات نہیں تھے اور آپ کو یقین ہے کہ سب کچھ ٹھیک چل رہا ہے۔ لیکن یہ چیک کرنے میں تکلیف نہیں ہوگی

کم از کم 95 فیصد صارفین کے لیے سب کچھ کام کرتا ہے اس بات کا یقین کرنے کے لیے آپ کو کتنے صارفین کو چیک کرنا پڑے گا ؟

یہاں کچھ خیالات ہیں:

  • اگر آپ چیک نہیں کرتے تو آپ نہیں جانتے: اعتماد 0٪ ہے۔ بہر حال ، شاید آپ کے بیچ اپ ڈیٹ نے بالکل کام نہیں کیا ، لیکن کوئی غلطی کے پیغامات نہیں تھے۔
  • اگر آپ سب کو چیک کرتے ہیں تو ، آپ کو جواب معلوم ہوگا: اعتماد 100 ہے۔ لیکن یہ بہت زیادہ کام ہوسکتا ہے…
  • اگر آپ کچھ صارفین کو چیک کرتے ہیں ، شاید 10 ، اور اپ ڈیٹ نے کام کیا… آپ اچھا محسوس کرنا شروع کر سکتے ہیں۔ آپ کتنا پراعتماد ہو سکتے ہیں؟

مجھے نہیں لگتا کہ جواب واضح ہے۔ مجھے اس کے بارے میں سوچنے کے لیے کچھ وقت نکالنا پڑا۔

ایک چکر: اوسط درجہ بندی

مجھے اوسط درجہ بندی کے لحاظ سے کس طرح ترتیب نہیں دینا پڑھنا یاد آیا ، اور میں نے سوچا کہ میں اس مسئلے پر اسی منطق کو لاگو کر سکتا ہوں۔

اگر آپ کے پاس صرف ایک جائزہ ہے ، اور یہ مثبت ہے ، تو کیا یہ 100 ہے؟ بدیہی طور پر ، ہم جانتے ہیں کہ ایسا نہیں ہے: یہ صرف ایک شخص کی رائے ہے۔ جیسا کہ زیادہ سے زیادہ لوگ مثبت جائزے دیتے ہیں ، ہم سکور کی درستگی کے بارے میں بہتر محسوس کرنا شروع کر سکتے ہیں۔

مضمون سے اقتباس یہ ہے:

میرے پاس جو ریٹنگ ہے اسے دیکھتے ہوئے ، 95 فیصد امکان ہے کہ مثبت درجہ بندی کاحقیقیحصہ کم از کم کیا ہے؟

ہم ولسن اعتماد کے وقفے کی نچلی حد کو استعمال کر سکتے ہیں۔

عملی طور پر ، R کے ساتھ۔

binom.wilsonتقریب سے binomپیکج، اس طرح استعمال کیا جا سکتا ہے:

> binom.wilson(18, 20)

    method  x  n mean     lower     upper

  1 wilson 18 20  0.9 0.6989664 0.9721335

دوسرے الفاظ میں ، اگر ہم نے 18 مثبت اور 2 منفی (18/20) کا نمونہ لیا تو ، “حقیقی” حصہ شاید 0.699 اور 0.972 کے درمیان آتا ہے (مطلب: 0.9)۔

ہماری مثال کے طور پر ، ہم اسے 100 success کامیابی کے ساتھ پکار سکتے ہیں:

> binom.wilson(10, 10)

    method  x  n mean     lower upper

  1 wilson 10 10    1 0.7224672     1

اوپری باؤنڈ دلچسپ نہیں ہے: ہمیں کیس کے بہترین منظر نامے میں دلچسپی نہیں ہے۔ لیکن اگر آپ 10 چیک کرتے ہیں اور وہ سب کامیاب ہیں تو ، آپ اعتماد محسوس کر سکتے ہیں کہ اس نے 72.2 فیصد صارفین کے لیے کام کیا۔

اگر ہم جانچتے رہیں ، اور ہمیں کامیابیاں ملتی رہیں ، تو ہم “حقیقی” کامیابی کے بارے میں زیادہ سے زیادہ یقین محسوس کر سکتے ہیں:

95 فیصد “حقیقی” کامیابی (ریڈ لائن) کے نچلے حصے تک پہنچنے میں 73 چیک لگتے ہیں۔

تجزیہ

یہاں ایک RMarkdown دستاویز اور نتیجہ آؤٹ پٹ html دستاویز کے طور پر تجزیہ ہے ۔