১৮০০ সালের দিকে Degrees of Freedom বা স্বাধীনতার মাত্রা সম্বন্ধে সর্বপ্রথম যিনি মৌলিক ধারণা দেন তিনি হচ্ছেন জার্মান গণিতবিদ ও জ্যোতির্বিদ কার্ল ফ্রেডরিক গাউস। এরপর ১৯০৮ সালে William Sealy Gosset তার Biometrika নামের আর্টিকেল এর "The probable error of a mean" নামের কলামে স্বাধীনতার মাত্রা (Degrees of Freedom) এর সংজ্ঞা প্রকাশ করেন । কিন্তু তিনি সেখানে সুনির্দিষ্ট ভাবে স্বাধীনতার মাত্রা (Degrees of Freedom) নামে প্রকাশ করেন নি । এরপর ১৯২২ সালে ইংরেজ পরিসংখ্যানবিদ Ronald Fisher তার Chi-square test ডেভোলপ করতে গিয়ে 'স্বাধীনতার মাত্রা' (Degrees of Freedom) শব্দটি ব্যবহার করেন ।
স্বাধীনতার মাত্রা (Degrees of Freedom) এর সংজ্ঞা এভাবে দেওয়া যায় ,
"In statistics, the number of degrees of freedom is the number of values in the final calculation of a statistic that are free to vary"
উদাহরণ দিলে ব্যাপারটা সহজে বোঝা যাবে। মনে করুন আপনি মোট নতুন ৭ টি শার্ট উপহার পেয়েছেন । এখন আপনি চাচ্ছেন সপ্তাহে সাতদিন আপনি প্রতিদিন একটি করে নতুন শার্ট পড়বেন , মানে শনিবার এ যেটা পড়বেন সেটা অন্য কোন বারে পড়বেন নাহ ।
তাহলে শনিবার থেকে শুরু করুন , শনিবারে আপনার কাছে অপশন আছে মোট ৭ টি , রবিবারে থাকবে ৬ টি , সোমবারে ৫ টি .........। কিন্তু শুক্রবারে আপনার কাছে ১ টি ছাড়া আর কোন অপশন থাকছে না। সো আপনি মোট ৬ বার আপনার ইচ্ছে মতো নিতে পারছেন । এই ৬ হলো Degrees of Freedom বা স্বাধীনতার মাত্রা ।
আবার ধরি, মোট ১০ টি সংখ্যা নিয়ে দেখাতে হবে যে তার যোগফল ৩০।
এখন আমরা সংখ্যা নেয়া শুরু করলাম নিজের ইচ্ছে মত ২+৪+৩+(-২)+......... এভাবে নয়টি সংখ্যা আমরা নিজের ইচ্ছে মত নিতে পারবো কিন্তু ১০ নাম্বার সংখ্যাটি নিতে গেলে আমরা ইচ্ছে মত আর নিতে পারবো না কারণ শর্ত হচ্ছে যোগফল ৩০ হতে হবে ।
একইভাবে আমাদের যদি n=২০ টি সংখ্যা থাকতো তাহলে ১৯টি ইচ্ছেমত নিতে পারতাম। কিন্তু শেষেরটি পূরণ করতে গেলে আমাদের কোন স্বাধীনতা অবশিষ্ট থাকতো না।
অর্থাৎ আমাদের স্বাধীনতার মাত্রা এক্ষেত্রে ২০-১ =১৯
মানে n-1 হচ্ছে Degrees of Freedom
মানে n-1 হচ্ছে Degrees of Freedom
অন্যকথায় বলা যায় ,
''The number of degrees of freedom equals the number of "observations" minus the number of required relations among the observations (e.g., the number of parameter estimates). For a 1-sample t-test, one degree of freedom is spent estimating the mean, and the remaining n - 1 degrees of freedom estimate variability.''
Chi-Square Test of Independence এর জন্যে Degrees of Freedom (স্বাধীনতার মাত্রা):
Chi-Square Test of Independence ব্যবহার করা হয় মূলত দুটো ক্যাটাগরিক্যাল ভেরিয়াবলস গুলা ডিপেন্ডেন্ট কিনা তা নির্ণয় করার জন্য ।
একটা ২*২ টেবিল চিন্তা করি
এখানে আমরা ইন্ডিপেন্ডেন্টলি সর্বোচ্চ একটা মান বসাতে পারবো কারণ পরের মান গুলো টোটাল মানের উপর নির্ভর করবে । তাহলে এখানে Degrees of Freedom (স্বাধীনতার মাত্রা) হচ্ছে ১
এখন যদি আমরা ৩*২ টেবিল চিন্তা করি তাহলে দেখতে পাবো
এখানে আমরা ইন্ডিপেন্ডেন্টলি সর্বোচ্চ দুইটা মান বসাতে পারবো কারণ পরের মান গুলো টোটাল মানের উপর নির্ভর করবে। তাহলে এখানে Degrees of Freedom (স্বাধীনতার মাত্রা) হচ্ছে ২
এভাবে যদি আমরা বিভিন্ন আকারের টেবিল চিন্তা করি তাহলে আমরা একটা general pattern পাবো . একটা table এর r রো স এবং c কলামস এর জন্যে সর্বোচ্চ (r-1)(c-1) সংখ্যক Degrees of Freedom (স্বাধীনতার মাত্রা) পাবো ।
ANOVA TABLE এর Degrees of Freedom (স্বাধীনতার মাত্রা):
- যদি মোট n সংখ্যক ডাটা পয়েন্ট থাকে , তাহলে Degrees of Freedom হবে n-1
- যদি m সংখ্যক গ্রুপ নিয়ে তুলনা করা হয় , তাহলে Degrees of Freedom হবে m-1
- যদি মোট n সংখ্যক ডাটা পয়েন্ট থাকে এবং m সংখ্যক গ্রুপ নিয়ে তুলনা করা হয় তাহলে error এর Degrees of Freedom হবে (n-1)-(m-1)=n-m
রেফারেন্স :
- http://blog.minitab.com/blog/statistics-and-quality-data-analysis/what-are-degrees-of-freedom-in-statistics
- https://onlinecourses.science.psu.edu/stat414/node/218
- wikipedia
লিখেছেন - শাওন শিকদার
very effective post
ReplyDelete