01/01/01 אמיר ווינשטוק עירן חוף שקופית מס ’ 1 מימוש ובדיקת אלגוריתם ללמידה ע"י חיזוקים עבור רובוט המשחק הוקי - אויר : מגישים עירן חוף אמיר ווינשטוק : מנחה.

Slides:



Advertisements
Similar presentations
Performed by: Andre Steiner Yael Dresner Instructor: Michael Levilov המעבדה למערכות ספרתיות מהירות High speed digital systems laboratory הטכניון - מכון.
Advertisements

Performed by: Tal Grylak Nadav Eitan Instructor: Moni Orbach Cooperated with: Eli Shushan המעבדה למערכות ספרתיות מהירות High speed.
Performed by: Karinne Attali Yotam Vit Instructor: Boaz Mizrahi המעבדה למערכות ספרתיות מהירות High speed digital systems laboratory הטכניון - מכון טכנולוגי.
Performed by: Rea Yeheskel Yair Sommer Instructor: Idan Katz Cooperated with:Motorola הטכניון - מכון טכנולוגי לישראל הפקולטה להנדסת חשמל Technion - Israel.
1 Student: Khinich Fanny Instructor: Fiksman Evgeny המעבדה למערכות ספרתיות מהירות High Speed Digital Systems Laboratory הטכניון - מכון טכנולוגי לישראל.
Performed by: Osnat Shlomo & Sharon Shlomo Instructor: Yossi Hipsh המעבדה למערכות ספרתיות מהירות High speed digital systems laboratory הטכניון - מכון טכנולוגי.
Performed by: Volokitin Vladimir Tsesis Felix Instructor: Mony Orbah המעבדה למערכות ספרתיות מהירות High speed digital systems laboratory הטכניון - מכון.
Performed by: Farid Ghanayem & Jihad Zahdeh Instructor: Ina Rivkin המעבדה למערכות ספרתיות מהירות High speed digital systems laboratory הטכניון - מכון טכנולוגי.
הטכניון – מכון טכנולוגי לישראל הפקולטה להנדסת חשמל המעבדה לחקר הראיה ומדעי התמונה שחזור תמונה באמצעות אלגוריתם MRF מבוסס מגישים : ערד שייבר ואיל שינדלר.
Presenters: Guy Elazar, Eyal Shindler Supervised By: Pavel Kislov, Inna Rivkin המעבדה למערכות ספרתיות מהירות High speed digital systems laboratory הטכניון.
Performed by:Fina Marganit Instructor: Ina Rivkin המעבדה למערכות ספרתיות מהירות High speed digital systems laboratory הטכניון - מכון טכנולוגי לישראל הפקולטה.
מצגת פרויקט עקיבה אחרי גוף נע פרויקט סמסטריאלי סטודנטים : וסילי גנקין מראט אקולוב מנחה : אריה נחמני סמסטר אביב תשס " ז.
בהסתברות לפחות למצא בעיה במודל PAC עבור בהסתברות ε הפונקציה f טועה מודל ONLINE 1. אחרי כל טעות הפונקציה משתפרת 2. מספר הטעיות קטן.
Performed by: Daniel Heifetz, Vladimir Lifliand Instructor: Dimitry Sokolik המעבדה למערכות ספרתיות מהירות High speed digital systems laboratory הטכניון.
Performed by: Oren Shalgi Alexander Badyan Instructor: Erez Zilber המעבדה למערכות ספרתיות מהירות High speed digital systems laboratory הטכניון - מכון טכנולוגי.
Performed by: Kobbi Kfir-El Ohad Brandelstein Instructor: Konstantin Sinyuk המעבדה למערכות ספרתיות מהירות High Speed Digital Systems Laboratory הטכניון.
מגישים: אנדרי זמנסקי יבגני שיפמן מנחה: ד"ר גבי דוידוב עקיבה אחרי ארבע מטרות תוך כדי מיון אוטומטי בשיטת קורלציה ו - JPDAF.
ספריה וירטואלית בטכנולוגית J2EE הטכניון – מכון טכנולוגי לישראל הפקולטה להנדסת חשמל המעבדה למערכות תוכנה עזרן אייל טרבלסי אורדן סמסטר חורף תשס " ד מנחה.
המעבדה למערכות ספרתיות מהירות High speed digital systems laboratory הטכניון - מכון טכנולוגי לישראל הפקולטה להנדסת חשמל Technion - Israel institute of technology.
Performed by: Sheetrit Idan Erlichman Sharon Instructor: Gandelsman Michael Cooperated with: Signal and Image Processing Laboratory המעבדה למערכות ספרתיות.
מודל ONLINE לומדמורה 1. כל ניתן לחישוב בזמן פולינומיאלי 2. אחרי מספר פולינומיאלי של טעיות ( ) הלומד לא טועה ז"א שווה ל- Littlestone 1988.
Performed by: Asaf Gal Elad Ilan Instructor: Alex Zviagintsev המעבדה למערכות ספרתיות מהירות High speed digital systems laboratory הטכניון - מכון טכנולוגי.
Performed by: Niv Tokman Guy Levenbroun Instructor: Leonid Boudniak המעבדה למערכות ספרתיות מהירות High speed digital systems laboratory הטכניון - מכון.
שיפור תמונות צבע תוך שימוש ב -Multiscale Retinex מבצעים : מרינה בלבנוב ירון זליכה מנחה : דר’ דורון שקד סמסטר חורף תשנ”ט.
1 הצגה בכינוס הערכת עלות מקורבת בסביבה סטוכאסטית מוגבלת קיבולת מרק אקלין מנחים: פרופ' יוחנן ארזי, פרופ' אבי שטוב.
איתור ותפיסת כדור לזריקה תוך שיתוף שתי זרועות רובוטיות הטכניון - מכון טכנולוגי לישראל הפקולטה להנדסת חשמל המעבדה לבקרה ורובוטיקה תופאחה חיסאוי יגאל סיגל.
Performed by: Vilk Pavel Pioter Drubetskoy Instructor: Mony Orbach Technion Digital laboratory המעבדה למערכות ספרתיות מהירות High speed digital systems.
Performed by: Yuval Peled Gal Gavish Instructor: Hen Broodney המעבדה למערכות ספרתיות מהירות High speed digital systems laboratory הטכניון - מכון טכנולוגי.
Performed by: Ehud Bahat & Amir Levy Instructor: Erez Zilber Cooperated with: המעבדה למערכות ספרתיות מהירות High speed digital systems laboratory הטכניון.
Performed by: Gadi Marcu & Tomer Alon Instructor: Erez Zilber המעבדה למערכות ספרתיות מהירות High speed digital systems laboratory הטכניון - מכון טכנולוגי.
1 Data Structures, CS, TAU, Perfect Hashing בעיה: נתונה קבוצה S של n מפתחות מתחום U השוואה ל- Hash : * טבלה קבועה (Hash רגיל - דינאמי) * רוצים זמן קבוע.
Performed by: Husam Khshiaboun & George Gantous Instructor: Yossi Hipsh המעבדה למערכות ספרתיות מהירות High speed digital systems laboratory הטכניון - מכון.
הטכניון – מכון טכנולוגי לישראל הפקולטה להנדסת חשמל מעבדה לבקרה ורובוטיקה בחינה של אלגוריתמים לעקיבה אחר טילים בליסטיים מגישים : נדב רוזנבלט ויבגני גנדין.
Performed by:Teb David Krelshtein Leonid Instructor: Itzkovitz Michael המעבדה למערכות ספרתיות מהירות High speed digital systems laboratory הטכניון - מכון.
Performed by: Rapoport Alexandra Instructor: Rivkin Eugene המעבדה למערכות ספרתיות מהירות High speed digital systems laboratory הטכניון - מכון טכנולוגי.
Performed by: Yifat Kuttner & Noam Gluzer Instructor: Boaz Mizrachi המעבדה למערכות ספרתיות מהירות High speed digital systems laboratory הטכניון - מכון.
Performed by: Tal Kormas Instructor: Alex Gerber המעבדה למערכות ספרתיות מהירות High speed digital systems laboratory הטכניון - מכון טכנולוגי לישראל הפקולטה.
Performed by: Lior Fayena & Assaf Almog Instructor: Emilia Burlak המעבדה למערכות ספרתיות מהירות High speed digital systems laboratory הטכניון - מכון טכנולוגי.
1 Final Presentation Optical Simulation System for Brain Waves Detection & Measurements המעבדה למערכות ספרתיות מהירות High speed digital systems laboratory.
Performed by: Smadar Katan & Gal Mendelson Instructor: Yossi Hipsh המעבדה למערכות ספרתיות מהירות High speed digital systems laboratory הטכניון - מכון טכנולוגי.
Performed by: Nir Engelberg & Ezequiel Hadid Instructor: Mony Orbach Cooperated with: Electrical Engineering Laboratory המעבדה למערכות ספרתיות מהירות High.
Performed by: Assaf Matia Instructor: Eran Segev המעבדה למערכות ספרתיות מהירות High speed digital systems laboratory הטכניון - מכון טכנולוגי לישראל הפקולטה.
XML Protocol for Manipulation and Control Elias Khoury Othman Kanj Final Presentation Supervisor: Mony Orbach הטכניון - מכון טכנולוגי לישראל הפקולטה להנדסת.
Performed by: Nadav Haklai Noam Rabinovici Instructor: Mike Sumszyk Spring Semester 2010 המעבדה למערכות ספרתיות מהירות High speed digital systems laboratory.
Performed by: David Eyal Handaly Gidi Instructor: Kats Idan Cooperated with: Rout Link המעבדה למערכות ספרתיות מהירות High speed digital systems laboratory.
המעבדה למערכות ספרתיות מהירות High speed digital systems laboratory הטכניון - מכון טכנולוגי לישראל הפקולטה להנדסת חשמל Technion - Israel institute of technology.
Performed by: Lotem Sharon, Yuval sela Instructor: Ina Rivkin Cooperated with: Piltest המעבדה למערכות ספרתיות מהירות High speed digital systems laboratory.
Performed by: Eliran Cohen & Michael Rapoport Instructor: Ina Rivkin המעבדה למערכות ספרתיות מהירות High speed digital systems laboratory הטכניון - מכון.
Performed by: Omer Katz Amir Flohr Instructor: Michael Itzkovitch המעבדה למערכות ספרתיות מהירות High speed digital systems laboratory הטכניון - מכון טכנולוגי.
Performed by: Anat Klempner Instructor: Malisha Marijan Prof. Yonina Eldar המעבדה למערכות ספרתיות מהירות High speed digital systems laboratory הטכניון.
Performed by: Ziv Landesberg Instructor:Evgeniy Kuksin המעבדה למערכות ספרתיות מהירות High speed digital systems laboratory הטכניון - מכון טכנולוגי לישראל.
Proxy Cache Engine Performed by: Artyom Borzin Stas Lapchev Instructor: Hen Broodney In cooperation with Magnifier Ltd. הטכניון - מכון טכנולוגי לישראל.
Performed by: Yair Sommer Rea Yeheskel Instructor: Idan Katz In Cooperation with:Motorola הטכניון - מכון טכנולוגי לישראל הפקולטה להנדסת חשמל Technion -
Performed by: Yulia Okunev Instructor: Yossi Hipsh המעבדה למערכות ספרתיות מהירות High speed digital systems laboratory הטכניון - מכון טכנולוגי לישראל הפקולטה.
Performed by:Valery Gorohovsky & Shmuel Koyas Instructor:Boaz Mizrahi Cooperated with:MobiWize 2012 spring המעבדה למערכות ספרתיות מהירות High speed digital.
Performed by: Kfir Toledo Tzofnat Grinberg Instructor: Ina Rivkin המעבדה למערכות ספרתיות מהירות High speed digital systems laboratory הטכניון - מכון טכנולוגי.
Ari Avitzur And Asher Pilai Performed by: Ari Avitzur And Asher Pilai Yossi Hipsh Instructor: Yossi Hipsh המעבדה למערכות ספרתיות מהירות High speed digital.
Performed by: Yuval Carmel Avihoo Mishael Instructor: Orbach Mony Cooperated with: Qualcomm Israel המעבדה למערכות ספרתיות מהירות High speed digital systems.
המעבדה למערכות ספרתיות מהירות High speed digital systems laboratory הטכניון - מכון טכנולוגי לישראל הפקולטה להנדסת חשמל Technion - Israel institute of technology.
Performed by: Nir Malka, Lior Rom Instructor: Mike Sumzik המעבדה למערכות ספרתיות מהירות High speed digital systems laboratory הטכניון - מכון טכנולוגי לישראל.
Performed by: Sameeh J & khalid A Instructor: Mony Orbach המעבדה למערכות ספרתיות מהירות High speed digital systems laboratory הטכניון - מכון טכנולוגי לישראל.
Performed by: Uri Kogan Instructor: Konstantin Siniuk Cooperated with: המעבדה למערכות ספרתיות מהירות High speed digital systems laboratory הטכניון - מכון.
דוח אמצע סמסטר אביב תשס"ב 2002 שם הפרויקט :סביבת בדיקה ל PCIX PCIX environment מנחה : איתי אדר מגישים : שמיל ניסימוב גוילי יואב הטכניון.
Performed by: Orit Arnon Dotan Barak Instructor: Yosi Hipsh המעבדה למערכות ספרתיות מהירות High speed digital systems laboratory הטכניון - מכון טכנולוגי.
Performed by: Or Rozenboim Gilad Shterenshis Instructor: Ina Rivkin המעבדה למערכות ספרתיות מהירות High speed digital systems laboratory הטכניון - מכון.
Performed by:Eliel Peretz Tamir Malka Instructor: Mony Orbach המעבדה למערכות ספרתיות מהירות High speed digital systems laboratory הטכניון - מכון טכנולוגי.
Performed by: Leon Karabchevsky Boaz Blankrot Instructor: Stanislav Shapiro Cooperated with: Pr. Levi Shehter Eli Shushan המעבדה למערכות ספרתיות מהירות.
Performed by: Igor Brevdo Euegeney Ryzik Instructor: Mony Orbach Cooperated with: המעבדה למערכות ספרתיות מהירות High speed digital systems laboratory הטכניון.
Performed by: Nadav Shiloach Sagi Sabag Instructor: Idan Shmuel Cooperated with: המעבדה למערכות ספרתיות מהירות High speed digital systems laboratory הטכניון.
Presentation transcript:

01/01/01 אמיר ווינשטוק עירן חוף שקופית מס ’ 1 מימוש ובדיקת אלגוריתם ללמידה ע"י חיזוקים עבור רובוט המשחק הוקי - אויר : מגישים עירן חוף אמיר ווינשטוק : מנחה שי מנור הטכניון - מכון טכנולוגי לישראל TECHNION - ISRAEL INSTITUTE OF TECHNOLOGY הפקולטה להנדסת חשמל המעבדה לקרה ורובוטיקה

01/01/01 אמיר ווינשטוק עירן חוף שקופית מס ’ 2 מטרת הפרויקט תכנון ובניית בקר לומד למשחק הוקי אוויר בעיות עיקריות : מרחב המצבים של המשחק רציף זמן הלימוד ארוך מאוד בחירת הפרמטרים של האלגוריתם אופטימיזציה של המימוש להאצת זמן הריצה (ANN)

01/01/01 אמיר ווינשטוק עירן חוף שקופית מס ’ 3 רקע : Reinforcement Learning Q-Learning Algorithm Instance-Base function approximate

01/01/01 אמיר ווינשטוק עירן חוף שקופית מס ’ 4 תאור Instance-Base

01/01/01 אמיר ווינשטוק עירן חוף שקופית מס ’ 5 1.Start from any Q-factor function Q(s,a) 2.Repeat until policy is optimum (enough): (a) After taking action a in state s, receiving reward r(s,a) and getting to state s, update Q-factor function: (b) Chose action a’ = argmax Q(s’,.) or explore. טבלאי Q-Learning אלגוריתם 1. After taking action a in state s, receiving reward r(s,a) and getting to state s’: (i)Cq = (s,a,Q) (ii)Find NN q set (iii) (iv) (v)Update: (vi)If min( { d(Cq,Ci) | Ci  NN q } ) >  D add Cq to database (vii)a’ = argmax a' Q(s',a') (viii)Take best action a’ in s’ or explore (ix)Repeat (1) until policy is optimum (enough) אלגוריתם Instance-Base Q-Learning

01/01/01 אמיר ווינשטוק עירן חוף שקופית מס ’ 6 במהלך הפרויקט מימשנו : 1. בקר בסיסי מבוסס על אלגוריתם Q-Learning עם מימוש טבלאי עבור מודל פשטני 2. בקר השולט על התאוצות השחקן בשני צירים, מבוסס על אלגוריתם Q ואלגוריתם Instace-Based 3. אלגוריתם חמדן לשיפור הפרמטרים הדרושים באלגוריתם Instace-Based 4. אפליקציה מבוססת MFC להצגת המשחק

01/01/01 אמיר ווינשטוק עירן חוף שקופית מס ’ 7 תוצאות : דוגמאות נבחרות מתוך הדו ” ח עבור הנושאים הבאים : Q-Learning טבלאי עבור מודל מפושט Q-Learning עם קירוב Instance-Base אלגוריתם חמדן

01/01/01 אמיר ווינשטוק עירן חוף שקופית מס ’ 8 Q-Learning טבלאי מספר השערים כפונקציה של מספר האיטרציות עבור ערכי קצבי עדכון שונים :

01/01/01 אמיר ווינשטוק עירן חוף שקופית מס ’ 9 Q-Learning עם קירוב Instance-Based שחקן יחיד ( לומד ) מותקף אופקית מאותו מקום באותה מהירות מספר ה cases לאחר איטרציות כפונקציה של ערך הסף (  D )

01/01/01 אמיר ווינשטוק עירן חוף שקופית מס ’ 10 Q-Learning עם קירוב Instance-Based שחקן יחיד ( לומד ) מותקף אופקית מאותו מקום באותה מהירות מספר הגולים המצטבר כפונקציה של האיטרציות של המודל הפיסיקלי עבור מספר ערכי  D

01/01/01 אמיר ווינשטוק עירן חוף שקופית מס ’ 11 Q-Learning עם קירוב Instanced-Base שחקן יחיד ( לומד ) מותקף אופקית מאותו מקום באותה מהירות תלות בפרמטרים : D  ערך סף להוספת מקרה חדש K  ערך סף למציאת שכנים קרובים גודל צעד יחס חקר (exploration) מטריקה תלות בתגמול

01/01/01 אמיר ווינשטוק עירן חוף שקופית מס ’ 12 Q-Learning עם קירוב Instance-Based שחקן יחיד ( לומד ) מותקף אופקית באותה מהירות ממקום אקראי כמה דוגמאות לתלות במטריקה : משקול אחיד

01/01/01 אמיר ווינשטוק עירן חוף שקופית מס ’ 13 משקול יחסי

01/01/01 אמיר ווינשטוק עירן חוף שקופית מס ’ 14 דוגמא למשחק מול שחקן יוריסטי :

01/01/01 אמיר ווינשטוק עירן חוף שקופית מס ’ 15 אופטימיזציה לפרמטרים ע ” י אלגוריתם חמדן :

01/01/01 אמיר ווינשטוק עירן חוף שקופית מס ’ 16 אלגוריתם חמדן המשך

01/01/01 אמיר ווינשטוק עירן חוף שקופית מס ’ 17 סרט אנימציה...

01/01/01 אמיר ווינשטוק עירן חוף שקופית מס ’ 18 מסקנות : תלות חזקה בפרמטרים של האלגוריתם. תלות חזקה בפונקצית הגמול. מספר האיטרציות להתכנסות גדול מאוד. במודלים מורכבים מספר המקרים (cases) גדול מאוד ( בעיה חישובית ). שימוש באלגוריתם חמדן למציאת פרמטרים מיטביים משפר את התוצאות.

01/01/01 אמיר ווינשטוק עירן חוף שקופית מס ’ 19 נושאים להמשך : אלגוריתם חמדן עם Annealing אלגוריתם חמדן לאופטימיזצית פונקצית הגמול למידת התקפה, מודל היררכי Co - Learning שכלול המודל הפיסיקלי של השולחן ( למשל אלמנטים סטטיסטיים ומכשולים ) מודל של רובוט המדמה זרוע אנושית לימוד של בקרה אנושית למשחק הוקי אוויר מימוש מערכת אמיתית