הבעיות שבהן מטפלת כריית מידע מתוך מאגרי המידע

כריית מידע (תמונה: Stuart Miles)

כריית מידע הוא אחד השירותים הניתן על ידי חברת מידע בע"מ ועליו אתם יכולים לקרוא על ידי לחיצה על הקישור. בקצרה, מדובר באלגוריתם מסוים או בתכנית מחשב שנועדה לחשוף מידע המצוי בתוך מאגרי המידע הקיימים. לאחר גילוי המידע, מבוצעת הסקת המסקנות. התהליך מבוצע באופן אוטומטי (עד כמה שהדבר מתאפשר), וזאת על מנת שיהיה ניתן לדעת דפוסי פעולה שחוזרים על עצמם, חריגות או התרחשויות אחרות ומשמעותיות.

במציאות של ימינו בעידן הביג דאטה (Big Data), קיימת חשיבות עליונה לביצוע טיוב נתונים מוצלח, כזה שיוביל לאחידות המידע, כדי שיהיה ניתן לבצע כריית מידע בצורה הטובה ביותר. המטרה העליונה בכריית המידע היא הפיכת מידע לידע של ממש שממנו ניתן לגזור אסטרטגיות פעולה. קיימים מספר אתגרים, או בעיות, שבהן כריית מידע יכולה לטפל. נפרט על הבעיות האלה כאן.

דוגמאות לבעיות

כריית מידע (תמונה: Stuart Miles)

כריית מידע (תמונה: Stuart Miles)

חוקי אסוציאציה – האלגוריתם המבצע כריית מידע למאגר מידע עסקי, אמור בין היתר לאתר קשרים מעניינים בין הנתונים. למשל: כאשר מתגלה חוקיות מסוימת בין פרמטרים שונים בבסיס הנתונים. קל להדגים את החוקיות באמצעות דוגמא קלאסית לניתוח עגלת קניות – כריית מידע תנסה למצוא חוקיות כלשהי בין מוצרים שונים שרכש לקוח בקנייה מסוימת. מניתוח עגלת קניות בחנות מחשבים למשל, אפשר להסיק שבדרך כלל נרכשים כמה מוצרים ביחד (עכבר אלחוטי יחד עם פד לעכבר, או אוזניות יחד עם סוללות). מהמסקנות שיתקבלו יהיה אפשר לקבל החלטה לסדר על המדפים את הסוללות לצד האוזניות.

סיווג מקרים חדשים – האלגוריתם אוסף נתונים מן העבר ומסיק מסקנה שלפיה יוכל לסווג מקרים חדשים. לדוגמא, חברת המבצעת ביטוחי חיים ובריאות ומעוניינת לחשב את רמת הסיכון. על סמך נתוני העבר ניתן לסווג מקרים מסוימים ועל בסיסם לחזות את רמת הסיכון של מבוטח חדש המגיע לחברה. בהתאם לרמת הסיכון, כידוע, נגזר מחיר הביטוח בכל חודש.

ניתוח אשכולות של רשומות – פעולה זו בצעת פילוח של הרשומות לאשכולות שונים. בכל אחד מהאשכולות ישנן רשומות שלהן מכנה או מספר מכנים משותפים והן דומות במאפייניהן. למשל: כאשר הרשומות הן לקוחות של רשת חנויות ספורט, ניתן לפלח אותם ולקבל מושג לגבי ההרגלים של הלקוחות האלו.