شرکتها از تجزیه و تحلیل پیشبینی کننده (Predictive Analytics) برای پیشبینی رویدادهای آینده بر مبنای دادههای گذشته استفاده میکنند. این روش به آنها کمک میکند تا فرصتها را شناسایی کنند و خطرات را کاهش بدهند، مانند برآورد ارزش طول عمر مشتریان (LTV یا CLV) یا برنامهریزی برای شرایط بد اقتصادی.تجزیه و تحلیل پیشبینی کننده شامل دادهکاوی، آمار و احتمالات و یادگیری ماشین است. به طور کلی پیشبینی کردن فرایند پیچیدهای است و احتمال اشتباه بودن آن زیاد است. بنابراین برای پیشبینی کردن باید با احتیاط قدم برداشت و ابزارها را هوشمندانه انتخاب کرد.
فرآیند تجزیه و تحلیل پیشبینی کننده
1. تعریف اهداف
مانند تمام روشهای تجزیه و تحلیل،گام اول برنامهریزی است. تیمها باید نیازهای هر واحد تجاری که درگیر هستند را بررسی کنند، مانند نیاز به محصول، بازاریابی، پشتیبانی مشتری یا تجزیه و تحلیل. تیمها باید اهداف آنها را شناسایی کنند و از سوالات آنها آگاه باشند. بدانند که آنها ترجیح میدهند چگونه دادهها را مشاهده کنند؟ یا آنها بیشتر به چه منابعی علاقه دارند؟
تیمهایی که قبل از بررسی موارد ذکرشده به پیشبینی میپردازند، اغلب اشتباه بودن نتایج خود را شاهد هستند.
آگاه باشید که گام اول، ایجاد یک برنامه ردیابی است و بدون آن، چیزی را از دست خواهید داد که هرچه در فرآیند پیش بروید، بازگشت به عقب و اصلاح آن امری دشوارتر است.
آیا برای راه اندازی تجزیه و تحلیل به کمک نیاز دارید؟ با خدمات حرفهای آنالیکا آشنا شوید.
راه حل های قدرتمند، بازاریابی هوشمند
2. جمع آوری داده ها
این مرحله، بیشترین زمان را صرف میکند. تیمها منابع داده خود را شناسایی میکنند؛ سپس صحت و بروز بودن دادهها را بررسی میکنند و منابع را به یک ابزار تجزیه و تحلیل (Analytics Tool) متصل میکنند. از آنجایی که بیشتر دادهها با گذشت زمان از بین میروند و اطلاعاتی مانند سوابق مشتری می تواند هر چند سال یکبار منقضی شود، غالبا انجام این مرحله طاقت فرسا میشود. گاهی حل یک مشکل داده، مشکلات دادههای بیشتری را نمایانگر میسازد و باعث گذر از محدودیتهای پروژه میشود.
گاهی اتصال دادهها به ابزار تجزیه و تحلیل آسان است، مانند زمانی که ابزار تجزیه و تحلیل یک اتصال از پیش آماده شده (pre-built connection) یا یک API و یا Webhooks را ارائه میدهد.
در موارد دیگر، باید به صورت دستی، با فایلهای CSV، پروتکلهای انتقال فایل (FTP) و کد سفارشی اتصال منابع به ابزار تجزیه و تحلیل انجام شود.
زمانی که دادهها یکپارچه شدند، میتوان دادهها را از چندین منظر در ابزار تجزیه و تحلیل مشاهده کرد. برای مثال، یک شرکت ارائه نرمافزار به صورت اینترنتی (SaaS) میتواند دادههای CRM، دادههای محصول، دادههای وبسایت، یادداشتهای مرکز تماس و ارائهدهندگان داده (data providers) شخص ثالث را به هم متصل کند و استنباط کند چگونه ستونهای کسبوکارش بر یکدیگر اثر میگذارند.
3. تجزیه و تحلیل
پس از آماده شدن دادهها، گروهها برای بررسی فرضیههای مختلف خود به استخراج اطلاعات (query) میپردازند. به عنوان مثال، بررسی میکنند که
- آیا قطع شدن محصول به پیشبینی حجم تماسهای پشتیبانی کمک میکند؟
- آیا کاربری که پروفایل خود را تکمیل میکند برای مدت طولانیتری مشتری باقی میماند؟
- …
افراد باید از اهمیت اطلاعات آماری که بدست میآورند آگاه باشند و یافته های خود را مورد بررسی و آزمایش قرار دهند تا از درستی آنها مطمئن شوند. عواملی مانند انتخاب نمونه آماری نادرست که رفتار آن نشان دهنده رفتار کل جامعه آماری نباشد، میتواند پیشبینیهایی را به دنبال داشته باشد که باعث اتخاذ تصمیمات اشتباه و گاهی پرهزینه شود. به عنوان مثال، اگر یک مرکز تماس با این فرض که حجم تماسهای دریافتی با شرایط آب و هوایی مرتبط است، تصمیم بگیرد کارمندان بیشتری را استخدام کند، در صورتی که این فرض نادرست باشد، این شرکت بودجه خود را برای پرداخت حقوق و دستمزد اضافی هدر داده است.
با آنالیکا هر کاری که بازدید کنندگان وب سایت شما انجام می دهند را بصورت ویدیوی ضبط شده تماشا کنید، توسط گزارشات و نمودار ها، داده های تجزیه و تحلیل شده را مشاهده نمایید و با ایجاد هدف برای بخش های مهم وب سایت خود و ارسال پیام هدفمند، نتایج بهتر کسب کنید.
4. مدلسازی دادهها
زمانی که پس از تجزیه و تحلیل به یک فرضیه درست و آزمایش شده دست یافتید، میتوانید مدلی را برای این فرضیه بسازید. اصطلاح مدل کمی گیجکننده است. منظور از مدل یک معادلهای است که یک رابطه را خلاصه میکند و یک نتیجه را نمایش میدهد و لزوما یک برنامه رایانهای نیست. به عنوان مثال، اگر اتفاق X رخ بدهد احتمال وقوع Y دو برابر میشود. هر معادله جبری، از نظر فنی، یک مدل است.
نمونه هایی از مدل های پیشبینی:
- ارائه دهنده نرمافزار (SaaS): مشتریانی که از بیش از 10 صفحه وب بازدید میکنند، 50 درصد بیشتر احتمال دارد که خرید کنند.
- تجارت الکترونیک: خریداری که از خرید کالایی منصرف شده است، سه برابر بیشتر احتمال دارد روی تبلیغات کلیک کند.
- رسانه و سرگرمی: شنوندگانی که سبک موسیقی هوی متال (heavy metal) را دوست دارند دو برابر بیشتر موسیقی راک (rock) را دنبال میکنند.
مدلهای جدید باید با اطلاعات موجود از گذشته آزمایش شود تا صحت نتایج آن مورد ارزیابی قرار بگیرد. به عنوان مثال، تیم پشت یک برنامه سرمایهگذاری شخصی میتواند عملکرد پورتفولیو را در بیست سال گذشته شبیهسازی کند تا اطمینان حاصل کند که مدل به درستی کار میکند و نتایج مدل با آنچه رخ داده است از تطابق قابل قبولی برخوردار است.
رایج ترین انواع مدلها عبارتند از:
- درخت تصمیم: درخت تصمیم یک فلوچارت مجازی برای لیست کردن تمام نتایج ممکن یک رویداد است. مدل درخت تصمیم سادهترین روش برای پیشبینی است و مخصوصا برای زمانی مناسب هستند که مدل دارای متغیرهای ناشناخته است.
- تجزیه و تحلیل رگرسیونی: با استفاده از رگرسیون ارتباط کمی چند متغیر را مشخص میکنیم. متغیرها میتوانند همبستگی ضعیف، همبستگی زیاد و یا اصلاً همبستگی نداشته باشند.
- مدلهای یادگیری ماشین: این مدل برای کشف رابطه بین متغیرها، از یک شبکه عصبی یا الگوریتم که از مغز انسان تقلید میکند، استفاده میکند. شبکههای عصبی قدرتمند هستند، اما همیشه نمیتوانند توضیح دهند که چرا به یک نتیجه خاص رسیدهاند.
5. گسترش و بازبینی
اگر یک مدل به درستی کار میکند، میتوانید از آن استفاده کنید. اما باید همیشه کارایی آن را با یک نمونه آماری مورد سنجش قرار دهید، همانطور که در زمان ارائه مدل آن را با دادههای گذشته مورد ارزیابی قرار دادید. اگر مدل نتایج را با دقت قابل قبولی پیشبینی نمیکند، بایستی مدل، دادهها و مفروضات اساسی خود را دوباره مورد بررسی قرار دهید.
6. نظارت
همچنان که دانش شما نسبت به مدلسازی دادهها افزایش مییابد، نیاز است که مدل خود را بروز کنید. معمولا مدلی که در یک محیط آزمایشی به درستی کار میکند، به ندرت در واقعیت بدون نیاز به تنظیم و اصلاح، نتایج مورد قبولی را به همراه دارد. استفاده از دادههای حاصل از عملکرد کاربران حقیقی، اولین گام به سمت بهبود مدل است و نتایج قابل اعتمادی را تولید میکند.
تفاوت تجزیه و تحلیل پیشبینی کننده (Predictive Analytics) با تجزیه و تحلیل تجویزی (Prescriptive Analytics)
تجزیه و تحلیل پیشبینی کننده و تجزیه و تحلیل تجویزی بسیار شبیه به هم هستند، با این تفاوت که تجزیه و تحلیل تجویزی یک گام فراتر میرود تا بتواند یک اقدام را توصیه یا آغاز کند. تحلیلهای پیشبینی کننده برای پیشبینی استفاده میشود در حالی که تحلیلهای تجویزی برای رایزنی و مشورت گرفتن مناسب هستند.
به طور کلی تجزیه و تحلیل بر اساس میزان تمرکز آنها بر آینده به چهار دسته تقسیم میشود:
- تجزیه و تحلیل توصیفی (Descriptive Analytics) : دادههایی در مورد گذشته ارائه میدهد.
- داده تشخیصی (Diagnostic Data) : دادهها را به صورت زنده نمایش میدهد.
- تجزیه و تحلیل پیشبینی کننده (Predictive Analytics) : رویدادهای آینده را با استفاده از دادههای گذشته پیشبینی میکند.
- تجزیه و تحلیل تجویزی (Prescriptive analytics) : رویدادهای آینده را پیشبینی میکند و اقدامات لازم را توصیه مینماید.
چالشهای تجزیه و تحلیل پیشبینی کننده
از آنجایی که نگهداری دادههای با حجم بالا، انجام محاسبات سریع و ساخت نرمافزارهای کاربرپسند ارزانتر شدهاند، همه شرکتها اکنون تلاش میکنند تحلیلهای پیشبینی کننده داشته باشند. بسیاری با عجله در انجام تحلیل مرتکب خطاهای اساسی مانند داشتن فرضیات غلط در مدلسازی میشوند. لذا چیزی که سریعتر از، استفاده از تحلیلهای پیشبینی کننده رشد میکند، استفاده نادرست از آن است.
روزی به پادشاهی در خواب هشدار داده شد که پسرش به زودی با نیزه کشته خواهد شد. پادشاه دچار پریشانی خاطر شد و پسرش را از شرکت در نبردها منع کرد و او را به همراه یک محافظ به شکار فرستاد تا او را در امان نگه دارد. اما محافظ، پسر پادشاه را در شکارگاه با نیزه کشت. فرض نادرست پادشاه مبنی بر اینکه فقط در نبرد خطر کشته شدن با نیزه وجود دارد منجر به مرگ پسرش شد.
با وجود اطلاعات بسیار، بیشتر افراد تصمیماتی مشابه با تصمیم پادشاه میگیرند و پیشبینیهایی بر اساس فرضیات غلط انجام میدهند. به عنوان مثال، شرکتها کارمندان بیشتری استخدام میکنند با این فرض که درآمدشان همچنان به رشد خود ادامه میدهد یا با این تصور که بازار تغییر نخواهد کرد، سرمایهگذاری میکنند و یا با این تصور که از نیازهای مشتریان آگاه هستند، محصولات خود را عرضه میکنند. فرضیهها مانند خطوط گسل هستند و مدلهایی را که بر روی آنها بنا میشوند را تهدید می کنند. اما، اگر دانش کافی وجود داشته باشد، حتی بدترین فرضها را میتوان خنثی و از اثرات منفی آن جلوگیری کرد.
همه مدلها از جهاتی اشتباه هستند، اما بعضی از آنها مفید هستند.
به گفته آمارشناس فقید جورج اس باکس (George S. Box) ، متخصصان اگر دقت نظر و وسواس کافی در مدلسازی داشته باشند، میتوانند به مدلها تکیه کنند. او در یک سخنرانی در سال 1978 گفت: «همه مدلها از جهاتی اشتباه هستند، اما بعضی از آنها مفید هستند.» همچنین او پیشنهاد کرد که همه مدلها باید مورد استنطاق و بازجویی قرار گیرند و در صورتی استفاده شوند که روشنگر و مفید باشند.
برای آزمایش مدلها باید فرضیات آن مورد بررسی قرار گیرد و تغییرات یا معیوب بودنشان مشخص شود. مانند:
- تصور غلط یکسان بودن آینده با گذشته
گاهی اوقات اتفاقاتی میافتد که قبلاً هرگز اتفاق نیفتاده است. به این رویدادها اصطلاحا رویداد قوی سیاه یا Black Swan Event میگویند، رویداد قوی سیاه رویدادی است که بسیار غیرمنتظره است و اثرات بسیار قابل توجهی دارد. بر اساس این تئوری هر اندازه مشاهدات قوهای سفید را ثبت کنید باز هم این فرضیه که همه قوها سفید هستند را اثبات نمیکند. (مگر اینکه تمام قوهای موجود را مشاهده کنید.) اما اگر تنها وجود یک قو سیاه محرز شود، نادرست بودن فرضیه مشخص میشود. از آنجایی که قوهای سیاه در دادههای گذشته رخ ندادهاند، یک مدل پیشگو نمیتواند آن را پیشبینی کند.
فرض تداوم رویهها رایج ترین فرض نادرست در تجارت است. به همین دلیل است که استیو بالمر (Steve Ballmer)، مدیر عامل مایکروسافت، پیشبینی کرد که آیفون هرگز موفق نخواهد شد یا اوراکل در فرصت ارائه نرمافزار مبتنی بر فضای ابری به کندی عمل کرد. طبق دادههای گذشته، مدیران آنها اشتباه نمیکردند.
- همبستگیهای اشتباه
فقط به این دلیل که دو رویداد با هم اتفاق میافتند، به این معنا نیست که یکی باعث دیگری میشود، یا اینکه در آینده به هم مرتبط خواهند بود.با این حال، وجود همبستگیهایی بین رویدادهای مختلف غیرقابل انکار است. تحلیلگران، بازاریابان، تیمهای محصول و مدیران پشتیبانی مشتری بعضا از مدلهایی استفاده میکنند که به نظر درست میآیند چرا که از دادهها استنتاج میشوند، اما جعلی و اساساً خرافات هستند. به عنوان مثال، تعداد جرثقیلهای قابل مشاهده در خط افق شهر، چرخه های ساختوساز را پیشبینی می کند یا سروصدای رسانههای اجتماعی می تواند نوسانات بازار سهام را پیشبینی کند.
- بیشبرازش (Overfitting)
مدلهای پیشبینی باید همزمان هم با دادههای گذشته مطابقت قابل قبولی داشته و هم در عین حال نسبتا ساده باشند تا بتوانند پیشبینی مناسبی از رویدادهای آینده ارائه دهند. زمانی که یک مدل بیش از حد پیچیده شده است، میتواند نشانهای باشد که مدل دچار بیشبرازش (Overfitting) شده است. در این حالت مدل با دادههای گذشته مطابقت کاملی دارد و بنابراین از ارزش پیشبینیهایش کاسته میشود. به عنوان مثال، شرکتی که پیشبینی میکند مشتری بعدیاش یک شرکت بیمه خواهد بود که نامش با A شروع میشود، زیرا این موضوع در مورد چندین مشتری اخیرش اتفاق افتاده است.
شکل زیر، این موضوع را به خوبی تشرح میکند.
- دادههای ناکافی
اغلب دادههای کافی یا مناسب برای پیشبینی دقیق در دسترس نیست و بعضا جمعآوری دادههای بیشتر، بسیار هزینهبر است. به عنوان مثال، یک شرکت فناوری ممکن است مجبور باشد با دهها هزار مشتری مصاحبه کند تا نتایج آماری قابلتوجهی را به دست آورد. گاهی، دادهها دارای جهتگیریهای ذاتی هستند، مانند نظرسنجی که فقط برای بخش خاصی از مشتریان صورت گرفته باشد و فقط شامل پاسخهای مشتریانی است که از خدمات رضایت داشتهاند و مایل بودند برای پرکردن نظرسنجی وقت بگذارند.
در انتها باید گفت، باید یک حس وسواسگونه سازنده ایجاد شود و پیش از آنکه صحت رابطهای اعلام شود، مفروضات و اعتبار مدل بیاندازه مورد آزمایش و بررسی قرار گیرد و حتی زمانی که صحت آن غیرقابل انکار به نظر میرسد از آزمودن آن صرف نظر نشود.
چه صنایعی از ابزارهای تحلیل پیشبینی کننده بهره میبرند؟
پلتفرمهای تحلیل پیشبینیکننده در هر صنعتی که از پیشدانش سود میبرد، استفاده میشود و تقریباً هر صنعتی را شامل میشود:
- تجارت الکترونیک: تبلیغ محصولات و پیشبینی رفتار خریداران
- فناوری مصرفی: پیشبینی نیازهای کاربران
- امور مالی: کنترل ریسک، اندازهگیری بازارها، پیشبینی رکود
- بیمه: ارزیابی ریسک، کشف تقلب و پیشبینی احتمال شکایت مشتری
- دولت: پیشبینی زمان تعمیر و بازسازی زیرساخت ها
- خدمات درمانی: شناسایی بیماران در معرض خطر، پیشبینی تقاضا برای تختهای بیمارستانی.
- تولید: نظارت بر کیفیت محصول، جلوگیری از افزایش بیقاعده قیمت، پیشبینی تقاضا برای خدمات شهری مانند برق.
- رسانه و سرگرمی: پیشبینی محبوبیت فیلمها و نمایشها، توصیه محتوا متناسب برای هر کاربر.
- ارتباطات از راه دور: فروش متقابل و افزایش فروش را به حداکثر برسانید، ارزش بازارهای جدید را اندازه بگیرید.
نمونههایی از کاربرد تحلیلهای پیشبینی کننده
- یک سایت رزرو بلیط مسافرتی را در نظر بگیرید که میخواهد سفرهایی را که مشتریان برای خرید انتخاب میکنند را پیشبینی کند و تعداد رزروهایش را افزایش دهد. این سایت میتواند از راهحل تحلیل پیشبینیکننده برای جمعآوری اطلاعات دقیقتر نسبت به واکنش بازدیدکنندگان به تغییرات محصول استفاده کند. در این حالت میتوانند هزینه رزرو را بدون آسیب رساندن شاخصهای مشتریمداری افزایش دهند و سایت را سودآورتر کند.
- یک سایت تجارت الکترونیک را فرض کنید که میخواهد بفهمد چگونه پیامها و بهبود محصولات میتواند مشتریان را به خرید بیشتر سوق دهد. این سایت میتواند از ویژگی تشخیص ناهنجاری استفاده کند تا به طور خودکار از نوسانات در رفتار کاربران آگاه شود. حال میتواند هر گامی که مشتریان برمیدارند را درک کند و اعلانهای مبتنی بر رفتار آنان را برای بازگرداندن مشتریان به برنامه ارسال نماید.
- یک شرکت بیمه را در نظر بگیرید که میخواهد بیمهگذاران خود را تجزیه و تحلیل کند تا بفهمد چه چیزی آنها را به این پلتفرم جذب کرده است و چه چیزی آنها را از خرید محصولات اضافی باز میدارد. ویژگی تشخیص ناهنجاری کمک میکند تا در مورد کاهش غیرمعمول و جهشهای خروج کاربران هشدار دهد تا بتواند یک قیف فروش (Sales Funnel) متناسب تشکیل بدهد که نرخ خرید را افزایش دهد.
چگونه با دقت پیش بینی کنیم؟
همانطور که گفته شد، پیشبینی کردن دشوار است. شرکتها میتوانند با سرمایهگذاری بر روی تیمها، ابزارها و آموزش، کمک کنند از مزایای پیشبینی بدون صدمه دیدن از جنبههای منفی آن بهره شوند و پیشبینیهای بهتری داشته باشند. به عنوان مثال، استخدام تحلیلگران و دانشمندان علم داده که در بررسی اطلاعات و ارائه پیشبینیها تخصص دارند یا مشارکت با پلتفرمهای تحلیلی که مشتریان موفقی در یک صنعت مشابه دارند و یا ایجاد دستورالعملهای پیشبینی.
تیم ها همیشه باید بپرسند:
آیا دادهها دقیق هستند؟
آیا آزمونها از نقطه نظر آماری معنادار هستند؟
مدل تحلیلی ما، بر چه مفروضاتی تکیه دارد؟
اگر این فرضیات تغییر کنند چه اتفاقی میافتد؟
خطرات استفاده از مدل تحلیل پیشبینی کننده چیست؟
با دقت نظر و وسواس کافی، پیشبینی صحیح امکانپذیر است. باید بادقت همه جوانب را بررسی کرد تا سریعتر و با احتیاط بیشتری نسبت به رقبا عمل شود و در آیندهای که شناخت دقیق آن امکانپذیر نیست، خود را در شرایط قابل قبولی قرار داد.
ثبت دیدگاه