אם עליך לפתח ניתוחים סטטיסטיים או הנדסיים מורכבים, באפשרותך לצמצם בשלבים ולחסוך בזמן באמצעות Analysis ToolPak. אתה מספק את הנתונים ואת הפרמטרים עבור כל ניתוח והכלי משתמש בפונקציות המאקרו הסטטיסטיות או ההנדסיות המתאימות לשם חישוב והצגה של התוצאות בטבלת פלט. כלים מסוימים יוצרים גם תרשימים בנוסף לטבלאות פלט.
ניתן להשתמש בפונקציות ניתוח הנתונים רק בגליון עבודה אחד בכל פעם. בעת ניתוח נתונים בגליונות עבודה מקובצים, התוצאות יופיעו בגליון העבודה הראשון וטבלאות מעוצבות ריקות יופיעו בגליונות העבודה הנותרים. כדי לבצע ניתוח נתונים בגליונות העבודה הנותרים, חשב מחדש את כלי הניתוח עבור כל גליון עבודה.
Analysis ToolPak כולל את הכלים המתוארים בסעיפים הבאים. כדי לגשת לכלים אלה, לחץ על ניתוח נתונים בקבוצה ניתוח בכרטיסיה נתונים. אם הפקודה ניתוח נתונים אינה זמינה, עליך לטעון את תוכנית התוספת Analysis ToolPak.
-
לחץ על הכרטיסיה קובץ, לחץ על אפשרויות ולאחר מכן לחץ על הקטגוריה תוספות.
-
בתיבה נהל, בחר בתוספות של Excel ולאחר מכן לחץ על עבור.
אם אתה משתמש ב- Excel עבור Mac, בתפריט הקובץ עבור אל כלים > תוספות של Excel.
-
בתיבה תוספות, בחר בתיבת הסימון Analysis ToolPak ולחץ על אישור.
-
אם Analysis ToolPak אינו מופיע בתיבה תוספות זמינות, לחץ על עיון כדי לאתר אותו.
-
אם אתה מקבל הודעה ש- Analysis ToolPak אינו מותקן כרגע במחשב שלך, לחץ על כן כדי להתקין אותו.
-
הערה: כדי לכלול פונקציות Visual Basic for Application (VBA) עבור Analysis ToolPak, באפשרותך לטעון את תוספת Analysis ToolPak - VBA באותו אופן שבו טענת את Analysis ToolPak. בתיבה תוספות זמינות, בחר בתיבת הסימון Analysis ToolPak - VBA.
כלי הניתוח של Anova מספקים סוגים שונים של ניתוח שונות. הכלי שבו עליך להשתמש תלוי במספר הפקטורים והמדגמים שברשותך מתוך האוכלוסיות שברצונך לבחון.
Anova: גורם יחיד
כלי זה מבצע ניתוח פשוט של שונות בנתונים עבור שתי דוגמאות או יותר. הניתוח מספק מבחן של ההיפותזה שכל מדגם נמשך מאותה התפלגות הסתברות המשמשת בסיס כנגד ההיפותזה החלופית שבה התפלגויות ההסתברות המשמשות בסיס אינן זהות עבור כל הדגימות. אם קיימות שתי דוגמאות בלבד, באפשרותך להשתמש בפונקציית גליון העבודה T.בדיקה . עם יותר משתי דוגמאות, אין כלליזציה נוחה של T.TEST, ו ניתן לבצע קריאה למודל Single Factor Anova במקום זאת.
Anova: דו-גורמי עם שכפול
כלי ניתוח זה יעיל כאשר נתונים מסווגים לפי שני ממדים שונים. למשל, בניסיון שמטרתו למדוד את גובהם של צמחים, ייתכן שהצמחים מקבלים סוגים שונים של דשן (לדוגמה, A, B, C) וכן גדלים בטמפרטורות שונות (לדוגמה, נמוכה, גבוהה). עבור כל אחד מששת הזוגות האפשריים של {מדשן, טמפרטורה}, יש לנו מספר שווה של תצפיות לגבי גובה הצמח. באמצעות כלי Anova זה, באפשרותנו לבחון:
-
אם גובה הצמחים עבור סוגי הדשן השונים נלקח מתוך אותה אוכלוסיה המשמשת כבסיס. הטמפרטורות אינן נלקחות בחשבון בניתוח זה.
-
אם גובה הצמחים עבור רמות הטמפרטורה השונות נלקח מתוך אותה אוכלוסיה המשמשת כבסיס. סוגי הדשן אינם נלקחים בחשבון בניתוח זה.
אם, בהתייחס להשפעות ההבדלים בין סוגי הדשנים הנמצאים בנקודת התבליט הראשונה וההבדלים בטמפרטורה הנמצאים בנקודת התבליט השניה, ששת המדגמים המייצגים את כל הזוגות של ערכי {מדשן, טמפרטורה} נלקחים מתוך אותה אוכלוסיה. ההיפותזה החלופית היא שישנן השפעות עקב זוגות {מדשן, טמפרטורה} ספציפיים, מעל ומעבר להבדלים המבוססים על מדשן בלבד או על טמפרטורה בלבד.
Anova: דו-גורמי ללא שכפול
כלי ניתוח זה יעיל כאשר נתונים מסווגים לפי שני ממדים שונים כמו במקרה בעל שני הפקטורים עם שכפול. עם זאת, כאשר כלי זה בשימוש, ההנחה היא שקיימת תצפית אחת בלבד עבור כל זוג (למשל, כל זוג {מדשן, טמפרטורה} בדוגמה הקודמת).
פונקציות גליון העבודה CORREL ו- PEARSON מחשבות הן את מקדם המתאם בין שני משתני מידה כאשר המידות בכל משתנה נצפות עבור כל אחד מנושאי N. (כל תצפית חסרה עבור כל נושא גורם להתעלם מהנושא בניתוח.) כלי ניתוח המתאם שימושי במיוחד כאשר קיימים יותר משני משתני מידה עבור כל אחד מנושאי N. היא מספקת טבלת פלט, מטריצת מתאם, המציגה את הערך של CORREL (או PEARSON) המוחל על כל זוג אפשרי של משתני מידה.
מקדם המתאם, כגון השונות המשותפת, הוא מדד למידה שבה שני משתני מידה "משתנים זה לזה". שלא כמו השונות המשותפת, מקדם המתאם מותאם לקנה המידה כך שהערך שלו אינו תלוי ביחידות שבהן מבוטאים שני משתני המידה. (לדוגמה, אם שני משתני המידה הם משקל וגובה, הערך של מקדם המתאם אינו משתנה אם העובי מומר ממגרמים לקילוגרמים.) הערך של מקדם מתאם כלשהו חייב להיות בין -1 לבין +1, כולל.
ניתן להשתמש בכלי ניתוח המתאם כדי לבחון כל זוג של משתני מידה במטרה לבדוק אם שני משתני המידה נוטים לנוע יחדיו — כלומר, אם ערכים גדולים של משתנה אחד נוטים להשתייך לערכים גדולים של השני (התאמה חיובית), אם ערכים קטנים של משתנה אחד נוטים להשתייך לערכים גדולים של השני (התאמה שלילית) או אם ערכים של שני המשתנים נוטים שלא להשתייך (התאמה קרובה ל- 0 (אפס)).
הן כלי המתאם והן כלי השונות המשותפת יכולים לשמש באותה סביבה, כאשר מובחנים N משתני מידה שונים בקבוצה של פריטים בודדים. הן כלי המתאם והן כלי השונות המשותפת מציגים טבלת פלט, מטריצה, המציגה את מקדם המתאם או את השונות המשותפת, בהתאמה, בין כל זוג של משתני מידה. ההבדל טמון בכך שמקדמי מתאמים חייבים להיות בטווח של -1 ו- +1 כולל. כלי שונות משותפת מקבילים אינם כפופים לקנה מידה מסוים. הן מקדם המתאם והן השונות המשותפת מודדים עד כמה שני משתנים "משתנים יחדיו".
הכלי 'שונות משותפת' מחשב את הערך של פונקציית גליון העבודה COVARIANCE. P עבור כל זוג משתני מידה. (שימוש ישיר בפונקציה COVARIANCE. P במקום כלי השונות המשותפת הוא חלופה סבירה כאשר קיימים רק שני משתני מידה, זאת, N=2.) הערך באלכסון של טבלת הפלט של כלי השונות המשותפת בשורה i, עמודה i הוא השונות המשותפת של משתנה המידה ה- i בפני עצמו. זוהי רק השונות באוכלוסיה עבור משתנה זה, כפי שחושב על-ידי הפונקציה VAR של גליון העבודה.נ.ב.
באפשרותך להשתמש בכלי השונות המשותפת כדי לבחון כל זוג משתני מידה במטרה לבדוק אם שני משתני המידה נוטים לנוע יחד — כלומר, אם ערכים גדולים של משתנה אחד נוטים להיות משויכים לערכים גדולים של השני (שונות משותפת חיובית), אם ערכים קטנים של משתנה אחד נוטים להיות משויכים לערכים גדולים של השני (שונות משותפת שלילית) או אם ערכים של שני המשתנים נוטים שלא להיות משויכים (שונות משותפת קרובה ל- 0 (אפס)).
כלי הניתוח Descriptive Statistics מחולל דוח של סטטיסטיקה בעלת משתנה יחיד עבור נתונים בטווח הקלט, תוך מתן מידע אודות המגמה וההשתנות הכלליות של הנתונים.
כלי הניתוח Exponential Smoothing מנבא ערך המבוסס על התחזית לתקופה הקודמת, כשהוא מותאם לשגיאה בתחזית קודמת זו. הכלי משתמש בקבוע המחליק a, שסדר הגודל שלו קובע את העוצמה שבה תחזיות מגיבות על שגיאות בתחזית הקודמת.
הערה: ערכים של 0.2 עד 0.3 מהווים קבועים הגיוניים להחלקה. ערכים אלה מציינים שיש להתאים את התחזית הנוכחית ב- 20 עד 30 אחוזים עבור השגיאה בתחזית הקודמת. קבועים גדולים יותר מפיקים תגובה מהירה יותר, אך עשויים לגרום להשלכות לא יציבות. קבועים קטנים יותר עשויים לגרום להשהיות ארוכות עבור ערכי תחזית.
כלי הניתוח F-Test Two-Sample for Variances מבצע בדיקת F של שני מדגמים כדי להשוות את השונות של שתי אוכלוסיות.
לדוגמה, ניתן להשתמש בכלי F-Test במדגמים של זמנים של כל אחת משתי קבוצות בתחרות שחייה. הכלי מספק את התוצאה של בדיקת ההיפותזה הריקה ששני מדגמים אלה מגיעים מהתפלגויות בעלות שונויות שוות, אל מול החלופה לפיה השונויות אינן זהות בהתפלגויות המשמשות כבסיס.
הכלי מחשב את הערך f של F-statistic (או F-ratio). ערך f הקרוב ל- 1 מספק הוכחה לכך שהשונויות באוכלוסייה המשמשות כבסיס שוות. בטבלת הפלט, אם f < 1, “P(F <= f) one-tail” מספק את ההסתברות של צפייה בערך F-statistic נמוך מ-f כאשר השונויות באוכלוסייה שוות ו-“F Critical one-tail” מספק את הערך הקריטי הקטן מ- 1 עבור רמת המובהקות שנבחרה, Alpha. אם f > 1, “P(F <= f) one-tail” מספק את ההסתברות של צפייה בערך F-statistic גבוה מ-f כאשר השונויות באוכלוסייה שוות, ו-“F Critical one-tail” מספק את הערך הקריטי הגדול מ- 1 עבור Alpha.
כלי הניתוח Fourier Analysis פותר בעיות במערכות ליניאריות ומנתח נתונים תקופתיים באמצעות שיטת Fast Fourier Transform (FFT) להמרת נתונים. כלי זה גם תומך בהמרות הפוכות, בהן ההופכי של נתונים שהומרו מחזיר את הנתונים המקוריים.
כלי הניתוח Histogram מחשב שכיחויות אינדיווידואליות ומצטברות עבור טווח תאים של נתונים וסלי נתונים. כלי זה מפיק נתונים עבור מספר המופעים של ערך בתוך ערכת נתונים.
לדוגמה, בכיתה של 20 תלמידים, ניתן לקבוע את התפלגות הציונים לפי קטגוריות של אותיות-ציונים. טבלה מסוג היסטוגרמה מייצגת את גבולות האותיות-ציונים ואת מספר הנקודות בין הגבול הנמוך ביותר לבין הגבול הנוכחי. התוצאה היחידה והנפוצה ביותר היא מצב הנתונים.
כלי הניתוח Moving Average משקף ערכים בתקופת התחזית, בהתבסס על הערך הממוצע של המשתנה על-פני מספר מוגדר של תקופות קודמות. ממוצע נע מספק מידע מגמה שממוצע פשוט של כל הנתונים ההיסטוריים יסתיר. השתמש בכלי זה כדי לחזות מכירות, רשימות מלאי או מגמות אחרות. כל ערך תחזית מבוסס על הנוסחה הבאה.
כאשר:
-
N הוא מספר התקופות הקודמות שיש לכלול בממוצע הנע
-
A j הוא הערך הממשי בזמן j
-
F j הוא הערך החזוי בזמן j
כלי הניתוח Random Number Generation ממלא טווח במספרים אקראיים עצמאיים הנלקחים מאחת ממספר התפלגויות. ניתן לאפיין את הנושאים באוכלוסיה באמצעות התפלגות הסתברות. לדוגמה, ניתן להשתמש בהתפלגות רגילה לאפיון האוכלוסיה של גובה של פרטים, או להשתמש בהתפלגות Bernoulli של שתי תוצאות אפשריות לאפיון האוכלוסיה של תוצאות הטלת מטבע.
כלי הניתוח Rank ו- Percentile מפיק טבלה המכילה את הדירוג הסודר והאחוז של כל ערך בערכת נתונים. באפשרותך לנתח את העמידה היחסית של ערכים בערכת נתונים. כלי זה משתמש בפונקציות גליון העבודה RANK. EQ ו- PERCENTRANK. INC. אם ברצונך לחשב ערכים קשורים, השתמש בפונקציה RANK. הפונקציה EQ , המתייחסת לערכים קשורים כאל בעלי דירוג זהה, או משתמשת בפונקציה RANK.הפונקציה AVG , המחזירה את הדירוג הממוצע עבור הערכים המקושרים.
כלי הניתוח Regression מבצע ניתוח של רגרסיה ליניארית באמצעות שיטת "least squares" להתאמת קו לקבוצת תצפיות. באפשרותך לנתח כיצד משתנה תלוי יחיד מושפע מהערכים של משתנה בלתי תלוי אחד או יותר. לדוגמה, באפשרותך לנתח כיצד מושפעים הביצועים של ספורטאי מגורמים כגון גיל, גובה ומשקל. ניתן להקצות חלקים במדדי הביצועים לכל אחד משלושה גורמים אלה, בהתבסס על קבוצת נתוני ביצועים ולאחר מכן להשתמש בתוצאות כדי לחזות את ביצועיו של ספורטאי חדש שלא נבחן.
הכלי Regression משתמש בפונקציית גליון העבודה LINEST.
כלי הניתוח Sampling יוצר מדגם מתוך אוכלוסיה על-ידי טיפול בטווח הקלט כאוכלוסיה. כאשר האוכלוסיה גדולה מדי לעיבוד או לציור בתרשים, ניתן להשתמש במדגם מייצג. באפשרותך גם ליצור מדגם המכיל רק את הערכים מחלק מסוים במחזור, אם אתה סבור שנתוני הקלט הם תקופתיים. לדוגמה, אם טווח הקלט מכיל נתוני מכירות רבעוניים, דגימה עם שיעור תקופתי של ארבע מציבה את הערכים מאותו רבעון בטווח הפלט.
כלי הניתוח Two-Sample t-Test בודקים את השוויון של ממוצעי האוכלוסיה העומדים בבסיס כל מדגם. שלושת הכלים משתמשים בהנחות שונות: שהשונויות של האוכלוסיה הן שוות, שהשונויות של האוכלוסיה אינן שוות וששני המדגמים מייצגים תצפיות של לפני טיפול ולאחר טיפול באותם נושאים.
עבור שלושת הכלים שלהלן, ערך מסוג t-Statistic, t, מחושב ומוצג כ- "t Stat" בטבלאות הפלט. בהתאם לנתונים, הערך t יכול להיות שלילי או חיובי. בהנחה של ממוצעי אוכלוסיה שווים בבסיס, אם t < 0, "P(T <= t) one-tail" נותן את ההסתברות שיאובחן ערך מסוג t-Statistic, שהינו שלילי יותר מ- t. אם t >=0, "P(T <= t) one-tail" נותן את ההסתברות שיאובחן ערך מסוג t-Statistic, שהינו חיובי יותר מאשר t. "t Critical one-tail" נותן את ערך החיתוך, כך שההסתברות של אבחנה בערך מסוג t-Statistic שהינו גדול או שווה ל- "t Critical one-tail" היא Alpha.
"P(T <= t) two-tail" נותן את ההסתברות שיאובחן ערך מסוג t-Statistic שהינו גדול יותר בערך מוחלט מאשר t. "P Critical two-tail" נותן את ערך החיתוך, כך שההסתברות של ערך t-Statistic מאובחן שהינו גדול יותר בערך מוחלט מאשר "P Critical two-tail" היא Alpha.
מבחן t: שני מדגמים מזווגים עבור ממוצעים
באפשרותך להשתמש במבחן מדגמים מזווגים כאשר מתקיים זיווג טבעי של תצפיות במדגמים, כגון בעת שקבוצת מדגם נבחנת פעמיים — לפני ואחרי ניסוי. כלי ניתוח זה והנוסחה שלו מבצעים Two-Sample Student's t-Test מזווג כדי לקבוע אם יש סבירות שתצפיות שנלקחו לפני טיפול ותצפיות שנלקחו לאחר טיפול הגיעו מהתפלגויות בעלות ממוצעי אוכלוסיה שווים. צורת t-Test זו אינה מניחה כי השונויות של שתי האוכלוסיות שוות.
הערה: בין התוצאות שכלי זה מפיק, ניתן למצוא שונות במאגר, מדד נצבר של התפשטות הנתונים בסביבת הממוצע, הנגזר מהנוסחה הבאה.
מבחן t: שני מדגמים בהנחת שוויון שונויות
כלי ניתוח זה מבצע t-Test עם שני מדגמים של סטודנט. צורת t-Test זו מניחה ששתי קבוצות הנתונים נלקחו מהתפלגויות עם אותן שונויות. הוא מוכר בשם מבחן t של שונות שווה עם שני מדגמים (הומוסדסטי). באפשרותך להשתמש ב- t-Test זה כדי לקבוע אם סביר להניח ששתי הדגימות הגיעו מהתפלגויות עם ממוצעי אוכלוסייה שווים.
מבחן t: שני מדגמים בהנחת אי-שוויון שונויות
כלי ניתוח זה מבצע t-Test עם שני מדגמים של סטודנט. צורה זו של מבחן T מניחה ששתי קבוצות הנתונים נלקחו מהתפלגויות עם שונויות שאינן שוות. הוא מוכר בשם מבחן T של שונות לא שווה עם שני מדגמים (הטרוסדסטי). בדומה למקרה של Equal Variances שלעיל, באפשרותך להשתמש במבחן T זה כדי לקבוע אם סביר להניח ששתי הדגימות הגיעו מהתפלגויות עם ממוצעי אוכלוסייה שווים. השתמש במבחן זה כאשר קיימים נושאים מובחנים בשתי הדגימות. השתמש במבחן Paired, המתואר להלן, כאשר קיימת קבוצה אחת של נושאים ושתי הדגימות מייצגות מדידות עבור כל נושא לפני ואחרי טיפול.
הנוסחה שלהלן משמשת לקביעת הערך הסטטיסטי t.
הנוסחה הבאה משמשת לחישוב דרגות החופש, df. מאחר שהתוצאה של החישוב בדרך כלל אינה מספר שלם, הערך של df מעוגל למספר השלם הקרוב ביותר כדי להשיג ערך קריטי מטבלת t. הפונקציה T של גליון העבודה של Excel.הפונקציה TEST משתמשת בערך df המחושב ללא עיגול, מכיוון שניתן לחשב ערך עבור T.TEST with a noninteger df. בשל גישות שונות אלה כדי לקבוע את דרגות החופש, התוצאות של T.הפונקציה TEST וכלי t-Test זה יהיו שונים במקרה של שונות לא שוויון.
z-Test: כלי הניתוח Two Sample for Means מבצע מבחן z לדוגמה שני אמצעים עם שונות ידועה. כלי זה משמש לבדיקת ההיפותזה ה- Null שאין הבדל בין שני ממוצעי אוכלוסיה כנגד השערות חלופיות מצד אחד או דו-צדדי. אם השונות אינן ידועות, הפונקציה Z של גליון העבודה.יש להשתמש בבדיקה במקום זאת.
בעת שימוש בכלי z-Test, יש להקפיד להבין את הפלט. "P(Z <= z) one-tail" הוא, למעשה, P(Z >= ABS(z)), ההסתברות של z-value הרחק מ- 0 באותו כיוון של ערך z המאובחן כאשר אין הבדל בין ממוצעי האוכלוסיה. "P(Z <= z) two-tail" הוא, למעשה, P(Z >= ABS(z) or Z <= -ABS(z)), ההסתברות של z-value הרחק מ- 0 בכל כיוון מאשר ערך z המאובחן כאשר אין הבדל בין ממוצעי האוכלוסיה. התוצאה הדו-זנבית היא רק התוצאה החד-זנבית כאשר היא מוכפלת פי 2. ניתן להשתמש בכלי z-Test גם עבור מקרים בהם ההיפותזה הריקה היא שקיים ערך ספציפי שאינו אפס עבור ההבדל בין שני ממוצעי האוכלוסיה. לדוגמה, ניתן להשתמש בבדיקה זו כדי לקבוע את הבדלי הביצועים בין שני דגמי מכוניות.
זקוק לעזרה נוספת?
תוכל תמיד לשאול מומחה ב- Excel Tech Community או לקבל תמיכה בקהילת Answers.
למידע נוסף
יצירת תרשים Pareto ב- Excel 2016
טעינת Analysis ToolPak ב- Excel
פונקציות ENGINEERING (חומר עזר)
קיצורי מקשים ומקשים ייעודיים ב- Excel