Presentation is loading. Please wait.

Presentation is loading. Please wait.

A. Frank File Organization File Organization Measures.

Similar presentations


Presentation on theme: "A. Frank File Organization File Organization Measures."— Presentation transcript:

1 A. Frank File Organization File Organization Measures

2 2 A. Frank File Organization Measures Wiederhold מגדיר שבעה מדדים להערכת מבני קבצים ( הקובץ ושבעת המדדים ). אנו נוסיף מדד שמיני ( לגבי ביטול - הסבר בהמשך ). יש מדד שטח אחד ושאר המדדים הם מדדי זמן. הפעולות בקובץ מבוצעות על ידי צרופים של חיפושים, קריאות וכתיבות של גושים. את מדדי הקבצים נעריך בעזרת כל הפרמטרים שלמדנו. סימון : n (=(nrf מספר רשומות בקובץ. b (= (nbf מספר גושים בקובץ.

3 3 A. Frank פרמטר Overall storage required per Record R - שטח אחסון לרשומה - המקום הכולל ( ברוטו ) בבתים הדרוש לאחסון של רשומה ביחס למבנה הקובץ (storage required per Record). אפשר לחשב מדד R ע " י חילוק סך שטח הקובץ בבתים במספר הרשומות בקובץ. עדיף לאחסן רשומה בשטח המתקרב לנטו שלה ( ממד R שואף לפרמטר R). מדד נטו נטו + בזבוז ברוטו

4 4 A. Frank Time to fetch any record - זמן הבאת רשומה (Fetch record) כלשהי מהקובץ ( כתשובה ראשונה לשאילתה ). דורש איתור מהיר של מיקום הרשומה מבחינת גוש הנתונים המתאים שלה, ואז שליפתה מגוש הנתונים שנקרא פנימה. הבאת רשומה כלשהי יקרה יותר מקריאת גוש הנתונים המכיל אותה ממען מסוים.

5 5 A. Frank Time to fetch next logical record זמן הבאת הרשומה הלוגית הבאה (fetch Next record). דורש קריאת הרשומה הלוגית הבאה לאחר האחרונה / הנוכחית שנקראה, לפי סדר לוגי טבעי או מושרה (induced) על הקובץ. הסדר הלוגי של הרשומות תלוי בארגון הקובץ והרשומות. רשומה זו אינה בהכרח הרשומה הפיסית הבאה.

6 6 A. Frank Time to insert any record - זמן הוספת רשומה (Insert record) כלשהי. הוספה באמצע דורשת אולי הזזה של רשומות אחרות, למול סיפוח append) ) שלא. כאשר Bfr > 1, יש צורך לקרוא ולכתוב גוש ( קריאת הגוש המתאים, הוספת הרשומה בתוכה, וכתיבתה מחדש )! הוספת רשומה כלשהי יקרה יותר מכתיבת גוש הנתונים המכיל אותה למען מסוים.

7 7 A. Frank Time to update any record - זמן עדכון רשומה (Update record) כלשהי. עדכון מבחינה לוגית הוא : הבאה + ביטול + הוספה. קריאת רשומה ( למעשה גוש ), שינויה בגוש, וכתיבתה מחדש In-place update)) של הגוש. יתכן כי גודל הרשומה משתנה. אם היא גדלה, יתכן שצריך לכתבה במקום חדש Out-place update)), לדוגמא בסוף, אחרי ביטול הרשומה הישנה כמובן. לגבי ביטול בשקף הבא.

8 8 A. Frank Time to delete any record ( ) - זמן ביטול רשומה (Delete record) כלשהי ( מדד לא רשמי – אפשר לגוזרו מ - ?). 2 גישות לביטול רשומה : פיסי ולוגי. ביטול פיסי של רשומה דורש הזזה בקובץ, ( כמו ב - ). ביטול לוגי ( בלי הזזות ) נעשה על ידי סימון מצבה (tombstone) בתחילת הרשומה וכתיבתה מחדש ( של הגוש שלה ) חזרה לדיסק. ) לגבי ביטול לוגי )

9 9 A. Frank Time for exhaustive read of file - זמן לקריאה ממצה (eXhaustive read) של כל הקובץ לפי הסדר הלוגי של הרשומות. יש צורך לקרוא את כל הרשומות בקובץ. יעילות פעולה זו תלויה במדד ( מלבד עלות הבאת הרשומה הראשונה ).

10 10 A. Frank Time to reorganize file - זמן לארגון מחדש של כל הקובץ (reorganize file). ( למה Y ?) מקביל לארגון מחדש של מבנה נתונים ( סיירת אשפה.(Garbage Collection כולל קריאה ( ממצה ) של הקובץ, זריקה של רשומות מבוטלות, וכתיבת הקובץ מחדש בשביל הרשומות שנשארו.

11 11 A. Frank Groupings of measures אפשר לסווג מדדי זמן לשתי קבוצות לפי מאפיינים של : 1. הפרימיטיבים של מודל תזרים : או לא ( השאר ). 2. פעולה המתבצעת על כל הקובץ : או על רשומה בודדת ( השאר ). 3. פעולה לפי הסדר הלוגי : או לא ( השאר ). 4. מדדים מאופייני קריאה (read- oriented):, לעומת מדדים מאופייני כתיבה ( write- oriented):.

12 12 A. Frank Questions to consider in measures בחישוב המדדים יש להתייחס, בין השאר, לסוגי השאלות הבאות : 1. האם הזרוע בגליל הנכון, או שיש צורך לחפש (seek)? ז. א., היש צורך להתחשב ב -s ? 2. איפה יחסית נמצאת הרשומה במסילה ? ז. א., להתחשב בהשהיה של r, 0 או 2r ? 3. האם קוראים רשומות בודדות או קוראים בקובץ ברצף ? ז. א., להשתמש ב - t או ב -'t ? 4. האם מתחשבים בשטח רשומה או גם בבזבוז ? ז. א., להשתמש ב -R או ב -W+R, או ב -B או ב -G+B ?

13 13 A. Frank Time to rewrite a just read block ReWriteTime to - זמן לכתיבה מחדש של גוש שזה עתה נקרא ( לדוגמא ב - ). זמן המתנהכתיבת הגוש

14 14 A. Frank Disk is representative technology הדיסק הוא אכן טכנולוגיה ייצוגית, תרתי משמע : – דיסק : 'S, B, R, W, Bfr, s, r, T, t, t – דיסק עם ראשים קבועים : במה שונה ? s = 0 – תקליטון : במה שונה ? ntc = 2 – סרט : במה שונה ? r = 0 ( בעצם r לא קיים ). לדוגמא בסרט : ולא אם לדייק יותר, הדיסק הוא אכן טכנולוגיה ייצוגית בזה שאפשר לנתח את שאר הטכנולוגיות בצורה דומה לניתוח שלו.

15 15 A. Frank Steps in analysis of file organization בהערכת מבנה קובץ, נתייחס ל - 6 שלבים / צעדים : 1. תאור / מבנה לוגי ( רעיון, פילוסופיה וכו '). 2. שימושים / יישומים אפשריים. 3. תאור / מבנה פיסי ( מימוש אחד או יותר ). 4. מעבר לא - פורמלי על הדינמיקה בקובץ והמדדים. 5. הערכה פורמלית של מבנה הקובץ. 6. סיכום, השוואה לאחור והסתכלות קדימה.

16 16 A. Frank File Organizations Basic File Organizations (1) Pile File (2) Sequential Files (3) Indexed-Sequential Files (4) Direct (Access) Files Higher-Level File Organizations (5) Multi-rings (Linear Files) (6) B-Trees (Non-Linear Multi-index Files)


Download ppt "A. Frank File Organization File Organization Measures."

Similar presentations


Ads by Google