Power of Statistics (Regression Analysis)

by 1:54 PM 0 comments



ANIRUDDHA ADHIKARY যখন কলেজে পড়তেন , তার বাসা থেকে কলেজের রাস্তার মধ্যখানে ধানমন্ডি-১৫ নম্বর। ওই জায়গাটাতে সবসময় কিভাবে যেন জ্যাম লেগে যেত।সে কয়েকদিন ধরে ব্যাপারটা দেখতে লাগল দাঁড়িয়ে, জ্যামটা লাগে কেন! তো সে কয়েকটা জ্যামের উপসর্গ বের করে ফেলল:
if not bus.angle == 90: raise JamLagbe
if left_road.rickshaw_density > 0.6: raise JamLagbe
সিটিবাস একটু কাত হয়ে থেকে যাত্রী উঠায়, তখন রাস্তায় সব লেন বন্ধ হয়ে জ্যাম লাগে। হাতের বাম দিকে থেকে রায়ের বাজারের ট্রাফিক আসে, ওইখানে রিক্সা বেশি থাকলে জ্যাম লাগে। ইত্যাদি।
এখন সে জ্যামের আগে সাধারণত কি কি ঘটনা ঘটে, বা জ্যাম ঘটানোর জন্য কি কি ঘটনা দায়ী তার একটা লিস্ট বানিয়ে ফেলল। এরপর একদিন তার বন্ধুর সাথে রিক্সায় যেতে যেতে বলল, “মামা দেখিস, এখনই জ্যাম লাগবে”। ও অবাক হয়ে দেখল আসলেই সব গাড়ি ঘোড়া দাঁড়িয়ে গেছে (কারণ একটা সিটিবাস যাত্রী তোলার জন্য ৪৫ ডিগ্রি অ্যাঙ্গেলে কাত হয়ে থেমে গেছে)! কিভাবে বলল? সে অবজার্ভ করে ডাটা থেকে ধরে নিয়েছিল
এরকম অনেক লক্ষণ দেখে বোঝা সম্ভব যে, জ্যাম লাগতে চলেছে। Statistics এর Regression analysis (computer এর ক্ষেত্রে বলে মেশিন লার্নিং ) এর অধিকাংশ সমস্যা কিন্তু এটাই – ডাটা থেকে সম্পর্ক বের করা (কিসের প্রভাবে আসলে ঘটনা ঘটছে) এবং সেই সম্পর্ক থেকে ভবিষ্যতে প্রেডিকশন করা। কিন্তু, জ্যামের লক্ষণ তো মাত্র এই কয়টা না, প্রত্যেকটা লক্ষণ বের করে আলাদা করে বারবার প্রোগ্রাম লেখা সম্ভব না। এরকম সমস্যা সমাধানের একটা উপায় হল ডিসিশন ট্রি, সাপোর্ট ভেক্টর মেশিন বা নিউরাল নেটওয়ার্ক ডিজাইন করা। প্রত্যেকটা টার্ম, অন্তত ডিসিশন ট্রি অবশ্যই গুগলে সার্চ করে দেখবেন 🙂

Shawon

Blogger,Developer, Programmer

0 comments:

Post a Comment