שיעור 16 –ניתוח סמנטי יעל נצר מדעי המחשב.

Slides:



Advertisements
Similar presentations
Completeness and Expressiveness. תזכורת למערכת ההוכחה של לוגיקה מסדר ראשון : אקסיומות 1. ) ) (( 2. )) ) (( )) ( ) ((( 3. ))) F( F( ( 4. ) v) ( ) v ((
Advertisements

Present Progressive NEGATIVE. Good Night Mr. Cohen It is night. It’s eleven o’clock. Mr. Cohen is in bed. His eyes are closed. He is sleeping. He isn’t.
כריית מידע -- Clustering
שיטות ניתוח - דוגמא משווה
מבוא למדעי המחשב לתעשייה וניהול
חוקי Association ד " ר אבי רוזנפלד. המוטיבציה מה הם הדברים שהולכים ביחד ? –איזה מוצרים בסופר שווה לשים ביחד –מערכות המלצה – Recommendation Systems שבוע.
Present Progressive Present Progressive הווה עכשווי / ממושך.
שיטות מחקר איכותניות שיעור מס' 3. התפתחות המחקר האיכותני במדעי החברה ובמחקר התקשורת:  התקופה המסורתית בחקר מדעי החברה ( סוף המאה ה -19- אמצע המאה ה -20)
שיטות מחקר איכותניות שיעור מס' 4.
ניתוח לקסיקלי וכלי Lex.
ניתוח תחבירי Top-Down.
דקדוקים חסרי הקשר Word categories (part of speech): NNountable, dogs, justice, oil VVerbrun, climb, love, ignore ADJAdjective green, fast, angry ADVAdverbsquickly,
משטר דינמי המשך – © Dima Elenbogen :55 חידה שכדאי לעבור עליה: 2011/ho/WCFiles/%D7%97%D7%99%D7%93%D7%94%20%D7%A2%D7%9D%20%D7%91%D7%95%D7%A0%D7%95%D7%A1.doc.
חורף - תשס " ג DBMS, Design1 שימור תלויות אינטואיציה : כל תלות פונקציונלית שהתקיימה בסכמה המקורית מתקיימת גם בסכמה המפורקת. מטרה : כאשר מעדכנים.
מכון ויצמן למדע - שמוליק מתוך 8 חישוב מקבילי ומבוזר מה זה יחידה חמישית במדעי המחשב... n ענף מתקדם במדעי המחשב העוסק במערכות ממוחשבות מרובות ישויות.
עיבוד שפות טבעיות natural language processing יעל נצר בינה מלאכותית מכללת אשקלון.
שאלות חזרה לבחינה. שאלה דיסקים אופטיים מסוג WORM (write-once-read-many) משמשים חברות לצורך איחסון כמויות גדולות של מידע באופן קבוע ומבלי שניתן לשנותו.
שיעור 10 – דקדוק חסר הקשר לאנגלית יעל נצר מדעי המחשב.
ניתוח תחבירי (Parsing) Wilhelm, and Maurer – Chapter 8 Aho, Sethi, and Ullman – Chapter 4 Cooper and Torczon – Chapter 3.
אוטומט מחסנית הפקולטה למדעי המחשב אוטומטים ושפות פורמליות ( ) תרגיל מספר 11.
מבוא לשפת C חידות ונקודות חשובות נכתב על-ידי יורי פקלני. © כל הזכויות שמורות לטכניון – מכון טכנולוגי לישראל.
Syllabus Text Books Classes Reading Material Assignments Grades Links Forum Text Books עיבוד שפות טבעיות - שיעור אחד עשר Unification (cont.) Semantics.
שיעור 15 – סמנטיקה יעל נצר מדעי המחשב.
CS 4705 Lecture 17 Semantic Analysis: Syntax-Driven Semantics.
מרצה: פרופסור דורון פלד
מסדי נתונים תשס " ג 1 תכנון סכמות – אלגוריתם פירוק לתבניות בצורת BCNF מסדי נתונים.
עיבוד תמונות ואותות במחשב אלכסנדר ברנגולץ דואר אלקטרוני : שיטות קידוד שיטות קידוד אורך מלת קוד ואנטרופיה אורך מלת קוד ואנטרופיה קידוד.
א " ב, מילים, ושפות הפקולטה למדעי המחשב אוטומטים ושפות פורמליות ( ) תרגיל מספר 1.
א " ב, מילים, ושפות הפקולטה למדעי המחשב אוטומטים ושפות פורמליות ( ) תרגיל מספר 1.
עיבוד שפות טבעיות - שיעור ראשון
Formal Specifications for Complex Systems (236368) Tutorial #6 appendix Statecharts vs. Raphsody 7 (theory vs. practice)
1 חישוב ואופטימיזציה של שאילתות חלק 2 Query Evaluation and Optimization Part 2.
עיבוד שפות טבעיות - שעור שני מורפולוגיה יעל נצר המחלקה למדעי המחשב אוניברסיטת בן גוריון.
מערכות הפעלה ( אביב 2009) חגית עטיה ©1 מערכת קבצים log-structured  ה log הוא העותק היחיד של הנתונים  כאשר משנים בלוק (data, header) פשוט כותבים את הבלוק.
א " ב, מילים, ושפות הפקולטה למדעי המחשב אוטומטים ושפות פורמליות ( ) תרגיל מספר 1.
Present Simple הווה פשוט
ערכים עצמיים בשיטות נומריות. משוואה אופינית X מציין וקטור עצמי מציינת ערך עצמי תואם לוקטור.
הפקולטה למדעי המחשב אוטומטים ושפות פורמליות (236353)
CS Introduction to AI Tutorial 6 AB Questions Tutorial 6 AB Questions.
משטר דינמי – © Dima Elenbogen :14. הגדרת cd ו -pd cd - הזמן שעובר בין הרגע שראשון אותות הכניסה יוצא מתחום לוגי עד אשר אות המוצא יוצא מתחום.
מערכים עד היום כדי לייצג 20 סטודנטים נאלצנו להגדיר עד היום כדי לייצג 20 סטודנטים נאלצנו להגדיר int grade1, grade2, …, grade20; int grade1, grade2, …, grade20;
עיבוד שפות טבעיות - שעור שלישי n-grams יעל נצר המחלקה למדעי המחשב אוניברסיטת בן גוריון.
עקרון ההכלה וההדחה.
שיעור 19 – lexical semantics המשך יעל נצר מדעי המחשב אונ ' בן גוריון.
תכנות מונחה עצמים Object Oriented Programming (OOP) אתגר מחזור ב' Templates תבניות.
תחשיב היחסים (הפרדיקטים)
שיעור 17 –Lexical Semantics יעל נצר מדעי המחשב. Lexical Semantics – התחום העוסק במערכת מבוססת המשמעות של המילים. Lexeme – " כניסה בלקסיקון " שהוא אוסף.
A. Frank File Organization Hardware Size Parameters.
Safari On-line books. מה זה ספארי ספארי זו ספריה וירטואלית בנושא מחשבים היא כוללת יותר מ כותרים כל הספרים הם בטקסט מלא ניתן לחפש ספר בנושא מסוים.
1 מבוא למדעי המחשב רקורסיה. 2 רקורסיה היא שיטה לפתרון בעיות המבוססת על העיקרון העומד ביסוד אינדוקציה מתמטית: אם ידועה הדרך לפתור בעיה עבור המקרים הבסיסיים.
Presentation by Gil Perry Supervised by Amos Fiat 1.
A Description of a person
1 Natural Language Processing Lecture Notes 11 Chapter 15 (part 1)
פיתוח מערכות מידע Class diagrams Aggregation, Composition and Generalization.
Practice session 3 תחביר ממשי ( קונקרטי ) ותחביר מופשט ( אבסטרקטי ) שיטות חישוב : Applicative & Normal Evaluation Partial Evaluation.
Practice session 3.  תחביר ממשי ( קונקרטי ) ותחביר מופשט ( אבסטרקטי )  שיטות חישוב : Applicative & Normal Evaluation.
1 טכנולוגיות אינטרנט מתפתחות: הווב הסמנטי ויישומיו אייל סלע מנהל פרויקטים, איגוד האינטרנט הישראלי ומשרד ה -W3C הישראלי 18/5/2011.
. Sequence Alignment Tutorial #3 © Ydo Wexler & Dan Geiger.
Syllabus Text Books Classes Reading Material Assignments Grades Links Forum Text Books עיבוד שפות טבעיות - שיעור 11 Semantics אורן גליקמן המחלקה.
קשר לוגי : סיבה ותוצאה. במשפט – דוגמות קלות בגלל הגשם החלטנו לא לנסוע לטיול לחיפה. הרצון שלי להצליח הניע אותי להשקיע בלימודים. ציפורים נודדות בין יבשות.
פס על כל העיר נורית זרחי.
Tirgul 12 Trees 1.
תירגול 14: מבני נתונים דינאמיים
פרוקטוז, C6H12O6 , חד-סוכר מיוחד
ממשקים - interfaces איך לאפשר "הורשה מרובה".
משימת חקר מכוון ללמידה משמעותית
הנעה חשמלית.
תזכורת מתרגולים אחרונים
Present Simple הווה פשוט
Shell Scripts בסביבת UNIX
Presentation transcript:

שיעור 16 –ניתוח סמנטי יעל נצר מדעי המחשב

מקורות הידע הדרושים לייצוג סמנטי משמעותן של מילים משמעות המצורפת למבנים תחביריים ידע על מבנה השיח ידע על ההקשר שבו נאמרים דברים ידע common sense על הנושא המדובר.

Syntax-driven semantic analysis בגישה זו נבנים מבני המשמעות של המבעים רק על סמך ידע לקסיקלי וידע תחבירי. בגישה זו משמעות של קלט אינה תלויה בהקשר בו הדברים נאמרים. אין מערכות רבות שעבורן ניתוח כזה מספק, והוא יכול להוות כשלב ביניים לפני ניתוח סמנטי עמוק יותר.

Syntax-driven semantic analysis הניתוח שנראה כאן מבוסס על עקרון ההרכבה principle of compositionality. הרעיון הוא שמשמעותו של משפט מורכבת מסך המשמעויות של חלקיו. משפטים אמנם בנויים ממלים שהן המרכיב הבסיסי של משמעות בשפה, אולם משמעות המשפט אינה מבוססת על משמעות המילים בלבד אלא גם על הסדר, הקיבוץ שלהם והיחסים בין המילים במשפט – כלומר, משמעות המשפט מבוססת באופן חלקי על המבנה התחבירי. ניתוח סמנטי מבוסס תחביר מתייחס לרכיבים וליחסים המסופקים על ידי חוקי דקדוק, כדוגמת אלה שראינו.

Pipeline approach to semantic analysis המנתח הסמנטי לא יפתור בעיות של רב משמעות. ניתן לצמצם רב משמעויות על ידי שימוש במתייג, prepositional phrase attachments ועוד שיטות של word sense disambiguation. Output Semantic Representation Input Parser Semantic Analyzer

Ai Caramba (1)

Ai Caramba serves meet (1) נניח שניתן היה לבנות משמעות קודם מתוך תת העץ שמתייחס לפועל serve, ואז את מבנה המשמעות של שני ה-np, על ידי קישור לתבנית שמכתיב הפועל. בעייה: המנתח הסמנטי צריך לדעת, למשל, שהפועל הוא שקובע את התבנית על פי ייבנה הייצוג, את מיקומו בעץ ומיהם הארגומנטים שלו, כמו גם מהו התפקיד הסמנטי של כל אחד מהארגומנטים. מכיוון שיש אינספור משפטים אפשריים, מנתח סמנטי יצטרך להכיר את המבנה של כל אחד ואחד מהם. פתרון: להשתמש בחוקים המייצרים את אותם אינסוף המשפטים והצירופים ולצרף להם את החוקים הסמנטים. (rule to rule hypothesis – Bach 1976).

איגוד סמנטיקה לחוקי דקדוק חסר הקשר איגוד חוקי גזירה חסרי הקשר עם semantic attachments – אלה הם מעין 'הוראות' לאיך לחשב ייצוג משמעות ממבנה על ידי חישוב משמעות חלקיו. A1…. n {f(j.sem, …., k.sem)} הסמנטיקה של A תסומן ב- A.sem ותחושב על ידי הפונקציה f על תת קבוצה של מרכיבים סמנטיים מתוך המרכיבים של A.

דוגמא ProperNoun -> AyCaramba {AyCaramba} MassNoun -> meat {Meat} משמעות של קודקוד תועתק בד"כ לקודקוד הורה כמו שהיא NP -> ProperNoun {ProperNoun.Sem} NP -> MassNoun {MassNoun.sem} הערך הסמנטי שיתקבל מגזירת העץ של Ay Caramba יהיה במקרה זה AyCaramba צריך להפריד בין הצירוף הסמנטי לחוק ובין הערך הסמנטי שמצורף לעץ גזירה. הראשון הוא קב' של הוראות איך לבנות ייצוג משמעות ואילו השני מורכב מתוצאות אותה בנייה.

איך תיוצג משמעות של פועל e,x,y ISA(e,serving)Server(e,x) Served(e,y) נסיון ראשון ליצג משמעות של פועל: Verb -> serves {e,x,y ISA(e,serving)Server(e,x) Served(e,y)} ייצוג הצירוף VP יכלול גם את serves וגם את meet, וצריך למצוא אופן לצרף את המשמעות של ה-NP עם זו של ה-V לתוך המשמעות הכוללת של הצירוף. e,x,y ISA(e,serving)Server(e,x) Served(e,Meat) “someone serves meat”