הצטרפו לקבוצות שלנו לקבלת עדכונים מרוכזים פעם בשבוע:

ווטסאפ:
http://wa.dwh.co.il
טלגרם:
http://telegram.dwh.co.il

חוק מס' 1 של מדע הנתונים (החדש)

More
9 years 3 weeks ago - 5 years 11 months ago #8405 by Edith Ohri
חוק מס' 1
בנתונים לא-מפוקחים, מספר המשתנים גדול ממספר הרשומות,
במצב זה אי אפשר להגיע לפתרון מתמטי/סטטיסטי.
מדע הנתונים החדש מאפשר פתרון ע"י צמצום מספר המשתנים ע"י הקבצת הרשומות (האירועים) לדפוסי דמיון שבתוכם המתארים הם זהים.

הסבר: בנתונים לא מפוקחים לכל אחד מ-k האירועים יש צירוף תנאים סביבתיים פרטיים משלו שיכול להשפיע על המטרה. אם מוסיפים לרשימת n המשתנים את תנאי הסביבה של האירועים, מקבלים סה"כ n+k משתנים שהוא גדול מ-k הרשומות. כדי להגיע לפתרון הכרחי במצב כזה להקטין את מספר המשתנים. מדע הנתונים החדש מבצע את ההקטנה ע"י הגדרה של ישויות חדשות - "קבוצות דמיון", שמאפשרות לנתח את הרשומות שבתוכן כאילו הן נוצרו בסביבה אחידה, כלומר – כאילו הן מפוקחות.

דוגמא:
ברשת מזון שממוקמת באזור מסוים בארץ ההנהלה מבקשת לדעת יותר על גורמי ההצלחה של מבצעי מכירות. ההנהלה יודעת מראש על שלושה גורמים: גודל ההנחה, עונתיות או התאריך בשנה, וקיומם של מבצעים מתחרים.
בניתוח דפוסי ההתנהגות נמצאו נניח 5 קבוצות ראשיות: לקוחות שאינם חברי מועדון הקונים מוצרי יוקרה, לקוחות הקונים יחסית הרבה מוצרים מסובסדים, חברי מועדון ותיקים בעלי הרגלים קבועים, חברי מועדון המשתמשים בשירותי משלוחים, ולקוחות המוציאים סכום בינוני בקנייה. נניח שרק קבוצות "המוצרים המסובסדים" ו"הלקוחות שמוציאים סכום בינוני" מגיבות בעירנות למבצעים, ויתר שלוש הקבוצות כמעט אדישות.
התמקדות בלקוחות של שתי הקבוצות המגיבות, עשוי לגלות גורמים שיגבירו את הצלחת המבצעים, כפי שהתבקש, ובנוסף לגלות תובנות שלא הוגדרו במטרה, כמו (נניח) התובנה שלקוחות המגיבים למבצעים נוטים להצטרף למועדון, ולקוחות שהם חברי מועדון משדרגים את היקף הקניות החודשי ואת ההזמנות באינטרנט.

www.researchgate.net/project/Philosophy-...r-big-data-analytics


אשמח לקבל הערות ושאלות.


בברכה
אדית
Last edit: 5 years 11 months ago by Edith Ohri. Reason: תיקון ניסוח והוספת דוגמא

Please התחברות to join the conversation.

Moderators: Edith Ohri
Time to create page: 0.323 seconds