وبلاگ آنالیکا
منظور از تحلیل‌های پیش‌بینی کننده چیست؟

منظور از تحلیل‌های پیش‌بینی کننده چیست؟

شرکت‌ها از تجزیه و تحلیل پیش‌بینی کننده (Predictive Analytics) برای پیش‌بینی رویدادهای آینده بر مبنای داده‌های گذشته استفاده می‌کنند. این روش به آنها کمک می‌کند تا فرصت‌ها را شناسایی کنند و خطرات را کاهش بدهند، مانند برآورد ارزش طول عمر مشتریان (LTV یا CLV) یا برنامه‌ریزی برای شرایط بد اقتصادی.تجزیه و تحلیل پیش‌بینی کننده شامل داده‌کاوی، آمار و احتمالات و یادگیری ماشین است. به طور کلی پیش‌بینی کردن فرایند پیچیده‌ای است و احتمال اشتباه بودن آن زیاد است. بنابراین برای پیش‌بینی کردن باید با احتیاط قدم برداشت و  ابزارها را هوشمندانه انتخاب کرد.

فرآیند تجزیه و تحلیل پیش‌بینی کننده

1. تعریف اهداف
مانند تمام روش‌های تجزیه و تحلیل،گام اول برنامه‌ریزی است. تیم‌ها باید نیازهای هر واحد تجاری که درگیر هستند را بررسی کنند، مانند نیاز به محصول، بازاریابی، پشتیبانی مشتری یا تجزیه و تحلیل. تیم‌ها باید اهداف آنها را شناسایی کنند و از سوالات آن‌ها آگاه باشند. بدانند که آن‌ها ترجیح می‌دهند چگونه داده‌ها را مشاهده کنند؟ یا آنها بیشتر به چه منابعی علاقه دارند؟
تیم‌هایی که قبل از بررسی موارد ذکرشده به پیش‌بینی می‌پردازند، اغلب اشتباه بودن نتایج خود را شاهد هستند.
آگاه باشید که گام اول، ایجاد یک برنامه ردیابی است و بدون آن، چیزی را از دست خواهید داد که هرچه در فرآیند پیش بروید، بازگشت به عقب و اصلاح آن امری دشوارتر است.

آیا برای راه اندازی تجزیه و تحلیل به کمک نیاز دارید؟ با خدمات حرفه‌ای آنالیکا آشنا شوید.

 

لوگوی آنالیکا

راه حل های قدرتمند، بازاریابی هوشمند

2. جمع آوری داده ها
این مرحله، بیشترین زمان‌ را صرف می‌کند. تیم‌ها منابع داده خود را شناسایی می‌کنند؛ سپس صحت و بروز بودن داده‌ها را بررسی می‌کنند و منابع را به یک ابزار تجزیه و تحلیل (Analytics Tool) متصل می‌کنند. از آنجایی که بیشتر داده‌ها با گذشت زمان از بین می‌روند و اطلاعاتی مانند سوابق مشتری می تواند هر چند سال یکبار منقضی شود، غالبا انجام این مرحله طاقت فرسا می‌شود. گاهی حل یک مشکل داده، مشکلات داده‌های بیشتری را نمایانگر می‌سازد و باعث گذر از  محدودیت‌های پروژه می‌شود.
گاهی اتصال داده‌ها به ابزار تجزیه و تحلیل آسان است، مانند زمانی که ابزار تجزیه و تحلیل یک اتصال از پیش آماده شده (pre-built connection) یا یک API و یا Webhooks را ارائه می‌دهد.
در موارد دیگر، باید به صورت دستی، با فایل‌های CSV، پروتکل‌های انتقال فایل (FTP) و کد سفارشی اتصال منابع به ابزار تجزیه و تحلیل انجام شود.
زمانی که داده‌ها یکپارچه شدند، می‌توان داده‌ها را از چندین منظر در ابزار تجزیه و تحلیل مشاهده کرد. برای مثال، یک شرکت ارائه نرم‌افزار به صورت اینترنتی (SaaS) می‌تواند داده‌های CRM، داده‌های محصول، داده‌های وب‌سایت، یادداشت‌های مرکز تماس و ارائه‌دهندگان داده (data providers) شخص ثالث را به هم متصل کند و استنباط کند چگونه ستون‌های کسب‌وکارش بر یکدیگر اثر می‌گذارند.

3. تجزیه و تحلیل
پس از آماده شدن داده‌ها، گروه‌ها برای بررسی فرضیه‌های مختلف خود به استخراج اطلاعات (query) می‌پردازند. به عنوان مثال، بررسی می‌کنند که

  • آیا قطع شدن محصول به پیش‌بینی حجم تماس‌های پشتیبانی کمک می‌کند؟
  • آیا کاربری که پروفایل خود را تکمیل می‌کند برای مدت طولانی‌تری مشتری باقی می‌ماند؟

افراد باید از اهمیت اطلاعات آماری که بدست می‌آورند آگاه باشند و یافته های خود را مورد بررسی و آزمایش قرار دهند تا از درستی آن‌ها مطمئن شوند. عواملی مانند انتخاب نمونه آماری نادرست که رفتار آن نشان‌ دهنده رفتار کل جامعه آماری نباشد، می‌تواند پیش‌بینی‌هایی را به دنبال داشته باشد که باعث اتخاذ تصمیمات اشتباه و گاهی پرهزینه شود. به عنوان مثال، اگر یک مرکز تماس با این فرض که حجم تماس‌های دریافتی با شرایط آب و هوایی مرتبط است، تصمیم بگیرد کارمندان بیشتری را استخدام کند، در صورتی که این فرض نادرست باشد، این شرکت بودجه خود را برای پرداخت حقوق و دستمزد اضافی هدر داده است.

با آنالیکا هر کاری که بازدید کنندگان وب سایت شما انجام می دهند را بصورت ویدیوی ضبط شده تماشا کنید، توسط گزارشات و نمودار ها، داده های تجزیه و تحلیل شده را مشاهده نمایید و با ایجاد هدف برای بخش های مهم وب سایت خود و ارسال پیام هدفمند، نتایج بهتر کسب کنید.

4. مدل‌سازی داده‌ها
زمانی که پس از تجزیه و تحلیل به یک فرضیه درست و آزمایش شده دست یافتید، می‌توانید مدلی را برای این فرضیه بسازید. اصطلاح مدل کمی گیج‌کننده است. منظور از مدل یک معادله‌ای است که یک رابطه را خلاصه می‌کند و یک نتیجه را نمایش می‌دهد و لزوما یک برنامه رایانه‌ای نیست. به عنوان مثال، اگر اتفاق X رخ بدهد احتمال وقوع Y دو برابر می‌شود. هر معادله جبری، از نظر فنی، یک مدل است.
نمونه هایی از مدل های پیش‌بینی:

  • ارائه دهنده نرم‌افزار (SaaS): مشتریانی که از بیش از 10 صفحه وب بازدید می‌کنند، 50 درصد بیشتر احتمال دارد که خرید کنند.
  • تجارت الکترونیک: خریداری که از خرید کالایی منصرف شده است، سه برابر بیشتر احتمال دارد روی تبلیغات کلیک کند.
  • رسانه و سرگرمی: شنوندگانی که سبک موسیقی هوی متال (heavy metal) را دوست دارند دو برابر بیشتر موسیقی راک (rock) را دنبال می‌کنند.

مدل‌های جدید باید با اطلاعات موجود از گذشته آزمایش شود تا صحت نتایج آن مورد ارزیابی قرار بگیرد. به عنوان مثال، تیم پشت یک برنامه سرمایه‌گذاری شخصی می‌تواند عملکرد پورتفولیو را در بیست سال گذشته شبیه‌سازی کند تا اطمینان حاصل کند که مدل به درستی کار می‌کند و نتایج مدل با آنچه رخ داده است از تطابق قابل قبولی برخوردار است.

رایج ترین انواع مدل‌ها عبارتند از:

  1. درخت تصمیم: درخت تصمیم یک فلوچارت مجازی برای لیست کردن تمام نتایج ممکن یک رویداد است. مدل درخت تصمیم ساده‌ترین روش برای پیش‌بینی است و مخصوصا برای زمانی مناسب هستند که مدل دارای متغیرهای ناشناخته است.
  2. تجزیه و تحلیل رگرسیونی: با استفاده از رگرسیون ارتباط کمی چند متغیر را مشخص می‌کنیم. متغیرها می‌توانند همبستگی ضعیف، همبستگی زیاد و یا اصلاً همبستگی نداشته باشند.
  3. مدل‌های یادگیری ماشین: این مدل برای کشف رابطه بین متغیرها، از یک شبکه عصبی یا الگوریتم که از مغز انسان تقلید می‌کند، استفاده می‌کند. شبکه‌های عصبی قدرتمند هستند، اما همیشه نمی‌توانند توضیح دهند که چرا به یک نتیجه خاص رسیده‌اند.

5. گسترش و بازبینی
اگر یک مدل به درستی کار می‌کند، می‌توانید از آن استفاده کنید. اما باید همیشه کارایی آن را با یک نمونه آماری مورد سنجش قرار دهید، همانطور که در زمان ارائه مدل آن را با داده‌های گذشته مورد ارزیابی قرار دادید. اگر مدل نتایج را با دقت قابل قبولی پیش‌بینی نمی‌کند، بایستی مدل، داده‌ها و مفروضات اساسی خود را دوباره مورد بررسی قرار دهید.

6. نظارت
همچنان که دانش شما نسبت به مدلسازی داده‌ها افزایش می‌یابد، نیاز است که مدل خود را بروز کنید. معمولا مدلی که در یک محیط آزمایشی به درستی کار می‌کند، به ندرت در واقعیت بدون نیاز به تنظیم و اصلاح، نتایج مورد قبولی را به همراه دارد. استفاده از داده‌های حاصل از عملکرد کاربران حقیقی، اولین گام به سمت بهبود مدل است و نتایج قابل اعتمادی را تولید می‌کند.

تفاوت تجزیه و تحلیل پیش‌بینی کننده (Predictive Analytics) با تجزیه و تحلیل تجویزی (Prescriptive Analytics)
تجزیه و تحلیل پیش‌بینی کننده و تجزیه و تحلیل تجویزی بسیار شبیه به هم هستند، با این تفاوت که تجزیه و تحلیل تجویزی یک گام فراتر می‌رود تا بتواند یک اقدام را توصیه یا آغاز کند. تحلیل‌های پیش‌بینی کننده برای پیش‌بینی استفاده می‌شود در حالی که تحلیل‌های تجویزی برای رایزنی و مشورت گرفتن مناسب هستند.

به طور کلی تجزیه و تحلیل بر اساس میزان تمرکز آنها بر آینده به چهار دسته تقسیم می‌شود:

  • تجزیه و تحلیل توصیفی (Descriptive Analytics) : داده‌هایی در مورد گذشته ارائه می‌دهد.
  • داده تشخیصی (Diagnostic Data) : داده‌ها را به صورت زنده نمایش می‌دهد.
  • تجزیه و تحلیل پیش‌بینی کننده (Predictive Analytics) : رویدادهای آینده را با استفاده از داده‌های گذشته پیش‌بینی می‌کند.
  • تجزیه و تحلیل تجویزی (Prescriptive analytics) : رویدادهای آینده را پیش‌بینی می‌کند و اقدامات لازم را توصیه می‌نماید.

انواع تجزیه تحلیل

 

چالش‌های تجزیه و تحلیل پیش‌بینی کننده 

از آنجایی که نگهداری داده‌های با حجم بالا، انجام محاسبات سریع و ساخت نرم‌افزارهای کاربرپسند ارزان‌تر شده‌اند، همه شرکت‌ها اکنون تلاش می‌کنند تحلیل‌های پیش‌بینی کننده داشته باشند. بسیاری با عجله در انجام تحلیل مرتکب خطاهای اساسی مانند داشتن فرضیات غلط در مدلسازی می‌شوند. لذا چیزی که سریع‌تر از، استفاده از تحلیل‌های پیش‌بینی کننده رشد می‌کند، استفاده نادرست از آن است.

روزی به پادشاهی در خواب هشدار داده شد که پسرش به زودی با نیزه کشته خواهد شد. پادشاه دچار پریشانی خاطر شد و پسرش را از شرکت در نبردها منع کرد و او را به همراه یک محافظ به شکار فرستاد تا او را در امان نگه دارد. اما محافظ، پسر پادشاه را در شکارگاه با نیزه کشت. فرض نادرست پادشاه مبنی بر اینکه فقط در نبرد خطر کشته شدن با نیزه وجود دارد منجر به مرگ پسرش شد.

با وجود اطلاعات بسیار، بیشتر افراد تصمیماتی مشابه با تصمیم پادشاه می‌گیرند و پیش‌بینی‌هایی بر اساس فرضیات غلط انجام می‌دهند. به عنوان مثال، شرکت‌ها کارمندان بیشتری استخدام می‌کنند با این فرض که درآمدشان همچنان به رشد خود ادامه می‌دهد یا با این تصور که بازار تغییر نخواهد کرد، سرمایه‌گذاری می‌کنند و یا با این تصور که از نیاز‌های مشتریان آگاه هستند، محصولات خود را عرضه می‌کنند. فرضیه‌ها مانند خطوط گسل هستند و مدل‌هایی را که بر روی آنها بنا می‌شوند را تهدید می کنند. اما، اگر دانش کافی وجود داشته باشد، حتی بدترین فرض‌ها را می‌توان خنثی و از اثرات منفی آن جلوگیری کرد.

همه مدل‌ها از جهاتی اشتباه هستند، اما بعضی از آن‌ها مفید هستند.

به گفته آمارشناس فقید جورج اس باکس (George S. Box) ، متخصصان اگر دقت نظر و وسواس کافی در مدلسازی داشته باشند، می‌توانند به مدل‌ها تکیه کنند. او در یک سخنرانی در سال 1978 گفت: «همه مدل‌ها از جهاتی اشتباه هستند، اما بعضی از آن‌ها مفید هستند.» همچنین او پیشنهاد کرد که همه مدل‌ها باید مورد استنطاق و بازجویی قرار گیرند و در صورتی استفاده شوند که روشنگر و مفید باشند.
برای آزمایش مدل‌ها باید فرضیات آن مورد بررسی قرار گیرد و تغییرات یا معیوب بودن‌شان مشخص شود. مانند:

  • تصور غلط یکسان بودن آینده با گذشته 
    گاهی اوقات اتفاقاتی میافتد که قبلاً هرگز اتفاق نیفتاده است. به این رویدادها اصطلاحا رویداد قوی سیاه یا Black Swan Event می‌گویند، رویداد قوی سیاه رویدادی‌ است که بسیار غیرمنتظره است و اثرات بسیار قابل توجهی دارد. بر اساس این تئوری هر اندازه مشاهدات قوهای سفید را ثبت کنید باز هم این فرضیه که همه قوها سفید هستند را اثبات نمی‌کند. (مگر اینکه تمام قوهای موجود را مشاهده کنید.) اما اگر تنها وجود یک قو سیاه محرز شود، نادرست بودن فرضیه مشخص می‌شود. از آنجایی که قوهای سیاه در داده‌های گذشته رخ نداده‌اند، یک مدل پیشگو نمی‌تواند آن را پیش‌بینی کند.

 

رویداد قوی سیاه

 

فرض تداوم رویه‌ها رایج ترین فرض نادرست در تجارت است. به همین دلیل است که استیو بالمر (Steve Ballmer)، مدیر عامل مایکروسافت، پیش‌بینی کرد که آیفون هرگز موفق نخواهد شد یا اوراکل در فرصت ارائه نرم‌افزار مبتنی بر فضای ابری به کندی عمل کرد. طبق داده‌های گذشته، مدیران آنها اشتباه نمی‌کردند.

  • همبستگی‌های اشتباه
    فقط به این دلیل که دو رویداد با هم اتفاق می‌افتند، به این معنا نیست که یکی باعث دیگری می‌شود، یا اینکه در آینده به هم مرتبط خواهند بود.با این حال، وجود همبستگی‌هایی بین رویدادهای مختلف غیرقابل انکار است. تحلیلگران، بازاریابان، تیم‌های محصول و مدیران پشتیبانی مشتری بعضا از مدل‌هایی استفاده می‌کنند که به نظر درست می‌آیند چرا که از داده‌ها استنتاج می‌شوند، اما جعلی و اساساً خرافات هستند. به عنوان مثال، تعداد جرثقیل‌های قابل مشاهده در خط افق شهر، چرخه های ساخت‌و‌ساز را پیش‌بینی می کند یا سر‌و‌صدای رسانه‌های اجتماعی می تواند نوسانات بازار سهام را پیش‌بینی کند.

 

  • بیش‌برازش (Overfitting)
    مدل‌های پیش‌بینی باید همزمان هم با داده‌های گذشته مطابقت قابل قبولی داشته و هم در عین حال نسبتا ساده باشند تا بتوانند پیش‌بینی مناسبی از رویدادهای آینده ارائه دهند. زمانی که یک مدل بیش از حد پیچیده شده است، می‌تواند نشانه‌ای باشد که مدل دچار بیش‌برازش (Overfitting) شده است. در این حالت مدل با داده‌های گذشته مطابقت کاملی دارد و بنابراین از ارزش پیش‌بینی‌هایش کاسته می‌شود. به عنوان مثال، شرکتی که پیش‌بینی می‌کند مشتری بعدی‌اش یک شرکت بیمه خواهد بود که نامش با A شروع می‌شود، زیرا این موضوع در مورد چندین مشتری اخیرش اتفاق افتاده است.
    شکل زیر، این موضوع را به خوبی تشرح می‌کند.

بیش برازش

 

  • داده‌های ناکافی
    اغلب داده‌های کافی یا مناسب برای پیش‌بینی دقیق در دسترس نیست و بعضا جمع‌آوری داده‌های بیشتر، بسیار هزینه‌بر است. به عنوان مثال، یک شرکت فناوری ممکن است مجبور باشد با ده‌ها هزار مشتری مصاحبه کند تا نتایج آماری قابل‌توجهی را به دست آورد. گاهی، داده‌ها دارای جهت‌گیری‌های ذاتی هستند، مانند نظرسنجی که فقط برای بخش خاصی از مشتریان صورت گرفته باشد و فقط شامل پاسخ‌های مشتریانی است که از خدمات رضایت داشته‌اند و مایل بودند برای پر‌کردن نظرسنجی وقت بگذارند.

در انتها باید گفت، باید یک حس وسواس‌گونه سازنده ایجاد شود و پیش از آنکه صحت رابطه‌ای اعلام شود، مفروضات و اعتبار مدل‌ بی‌اندازه مورد آزمایش و بررسی قرار گیرد و حتی زمانی که صحت آن غیرقابل انکار به نظر می‌رسد از آزمودن آن صرف نظر نشود.

چه صنایعی از ابزارهای تحلیل پیش‌بینی‌ کننده بهره می‌برند؟
پلتفرم‌های تحلیل پیش‌بینی‌کننده در هر صنعتی که از پیش‌دانش سود می‌برد، استفاده می‌شود و تقریباً هر صنعتی را شامل می‌شود:

  • تجارت الکترونیک: تبلیغ محصولات و پیش‌بینی رفتار خریداران
  • فناوری مصرفی: پیش‌بینی نیازهای کاربران
  • امور مالی:  کنترل ریسک، اندازه‌گیری بازارها، پیش‌بینی رکود
  • بیمه: ارزیابی ریسک، کشف تقلب و پیش‌بینی احتمال شکایت مشتری
  • دولت: پیش‌بینی زمان تعمیر و باز‌سازی زیرساخت ها
  • خدمات درمانی: شناسایی بیماران در معرض خطر، پیش‌بینی تقاضا برای تخت‌های بیمارستانی.
  • تولید: نظارت بر کیفیت محصول، جلوگیری از افزایش بی‌قاعده قیمت، پیش‌بینی تقاضا برای خدمات شهری مانند برق.
  • رسانه و سرگرمی: پیش‌بینی محبوبیت فیلم‌ها و نمایش‌ها، توصیه محتوا متناسب برای هر کاربر.
  • ارتباطات از راه دور: فروش متقابل و افزایش فروش را به حداکثر برسانید، ارزش بازارهای جدید را اندازه بگیرید.

نمونه‌هایی از کاربرد تحلیل‌های پیش‌بینی کننده

  1. یک سایت رزرو بلیط مسافرتی را در نظر بگیرید که می‌خواهد سفرهایی را که مشتریان برای خرید انتخاب می‌کنند را پیش‌بینی کند و تعداد رزروهایش را افزایش دهد. این سایت می‌تواند از راه‌حل تحلیل پیش‌بینی‌کننده برای جمع‌آوری اطلاعات دقیق‌تر نسبت به واکنش بازدیدکنندگان به تغییرات محصول استفاده کند. در این حالت می‌توانند هزینه رزرو را بدون آسیب رساندن شاخص‌های مشتری‌مداری افزایش دهند و سایت را سودآورتر کند.
  2. یک سایت تجارت الکترونیک را فرض کنید که می‌خواهد بفهمد چگونه پیام‌ها و بهبود محصولات می‌تواند مشتریان را به خرید بیشتر سوق دهد. این سایت می‌تواند از ویژگی تشخیص ناهنجاری استفاده کند تا به طور خودکار از نوسانات در رفتار کاربران آگاه شود. حال می‌تواند هر گامی که مشتریان برمی‌دارند را درک کند و اعلان‌های مبتنی بر رفتار آنان را برای بازگرداندن مشتریان به برنامه ارسال نماید.
  3. یک شرکت بیمه را در نظر بگیرید که می‌خواهد بیمه‌گذاران خود را تجزیه و تحلیل کند تا بفهمد چه چیزی آنها را به این پلتفرم جذب کرده است و چه چیزی آنها را از خرید محصولات اضافی باز می‌دارد. ویژگی تشخیص ناهنجاری کمک می‌کند تا در مورد کاهش غیرمعمول و جهش‌های خروج کاربران هشدار دهد تا بتواند یک قیف فروش (Sales Funnel) متناسب تشکیل بدهد که نرخ خرید را افزایش دهد.

چگونه با دقت پیش بینی کنیم؟

همانطور که گفته شد، پیش‌بینی کردن دشوار است. شرکت‌ها می‌توانند با سرمایه‌گذاری بر روی تیم‌ها، ابزارها و آموزش‌‌، کمک کنند از مزایای پیش‌بینی‌ بدون صدمه دیدن از جنبه‌های منفی آن بهره شوند و پیش‌بینی‌های بهتری داشته باشند. به عنوان مثال، استخدام تحلیلگران و دانشمندان علم داده که در بررسی اطلاعات و ارائه پیش‌بینی‌ها تخصص دارند یا مشارکت با پلتفرم‌های تحلیلی که مشتریان موفقی در یک صنعت مشابه دارند و یا ایجاد دستورالعمل‌های پیش‌بینی.

تیم ها همیشه باید بپرسند:

آیا داده‌ها دقیق هستند؟
آیا آزمون‌ها از نقطه نظر آماری معنا‌دار هستند؟
مدل تحلیلی ما، بر چه مفروضاتی تکیه دارد؟
اگر این فرضیات تغییر کنند چه اتفاقی می‌افتد؟
خطرات استفاده از مدل تحلیل پیش‌بینی کننده چیست؟
با دقت نظر و وسواس کافی، پیش‌بینی صحیح امکان‌‌پذیر است. باید با‌دقت همه جوانب را بررسی کرد تا سریع‌تر و با احتیاط بیشتری نسبت به رقبا عمل شود و در آینده‌ای که شناخت دقیق آن امکان‌پذیر نیست، خود را در شرایط قابل قبولی قرار داد.

 

لوگوی وبلاگ آنالیکا

ثبت دیدگاه