اتخاذ تصمیم عقلانی بصورت توزیع شده. آزمایشگاه سیستمهای هوشمند www.ceit.aut.ac.ir/islab 2 رئوس مطالب ویژگی های مکانیسم اتخاذ تصمیم مزایده ( حراج ) پارامترهای.

Slides:



Advertisements
Similar presentations
Awe sim.
Advertisements

معاونت درمان امور مامایی اردیبهشت 90. برای ثبت اطلاعات در برنامه نرم افزاری نظام مراقبت مرگ پریناتال ابتدا لازم است برنامه نرم افزار info-path وپرنیان.
انواع اصلی عامل ها.
فاکتورهای مهم در ایجاد یک مقاله علمی
الگوریتم ژنتیکی. تعریف  الگوریتم ژنتیکی، رویه ای تکراری است که راه حل های انتخابیش را بصورت رشته ای از ژنها که کروموزوم نامیده می شوند، بازنمایی می کند.
Definition. قانون بیز P(b|a) = P(a|b)P(b)/P(a) P(b|a) = P(a|b)P(b)/P(a) این قانون برای استنتاج آماری استفاده می شود. این قانون برای استنتاج آماری استفاده.
محدثه گل پرور, ملاحت ملکی استاد راهنما : مهندس برادران هاشمی.
Decision Tree.
© 2005 Prentice Hall Inc. All rights reserved. o r g a n i z a t i o n a l b e h a v i o r e l e v e n t h e d i t i o n.
تعاملات در سیستم چندعامله
معماری عامل ها.
همکاری و هماهنگی بین عاملها
ارتباط بین عاملها.
DSS in Actions. شرکت آتلانتیک الکتریک یک شرکت پیمانکاری سرویس دهی کامل الکتریکی برای کارهای صنعتی و تجاری است که در سال 1969 در چارلزتن تاسیس شد. یک شرکت.
فایل پردازی در C File based Programming in C. انواع فایل متنی –سرعت بالا –حجم کمتر –امکان دسترسی تصادفی –حفظ امنیت داده ها دودویی (باینری) –امکان باز.
1 Network Address Translation (NAT). 2 Private Network شبکه خصوصی شبکه ای است که بطور مستقیم به اینترنت متصل نیست در یک شبکه خصوصی آدرس های IP به دلخواه.
روش تحقیق جلسه چهارم دانشگاه صنعتی اصفهان دانشکده کشاورزی
موضوع: دبير مربوطه: آموزشگاه : اجرا : عبارتهای جبری خانم مقصودی
مظفر بگ محمدی دانشگاه ایلام Generics. کدهای عمومی 2 یکی از اهداف OOP ایجاد قابلیت نوشتن برنامه های عمومی با قابلیت استفاده ی مجدد است. کدهای چندریخت تا.
Arrangements of Lines C omputational Geometry By Samaneh shafi naderi
CS Constraint Satisfaction Constraint Satisfaction Problems Chapter 5 Section 1 – 3 Modified by Vali Derhami.
آشنايي با سيستم اعداد.
Eric S. K. Yu Faculty of Information Studies, University of Toronto
[c.
Business Process Modeling
تهیه و تنظیم: فاطمه قاسمی دانشگاه صنعتی شریف – پاییز 86
مکان یابی در شبکه های حسگر بیسیم
نظریه رفتار برنامه ريزي شده Theory of Planned Behavior
تمرین هفتم بسم الله الرحمن الرحیم درس یادگیری ماشین محمدعلی کیوان راد
هیدروگراف(Hydrograph) تهیه : دکتر محمد مهدی احمدی
ویژگی های DHCP جلوگیری از Conflict سرعت بخشیدن به کارها مدیریت متمرکز
بنام خدا زبان برنامه نویسی C (21814( Lecture 12 Selected Topics
SY800 router mode [AD-14-TB ].
برنامه ریزی خطی پیشرفته (21715( Advanced Linear Programming Lecture 11
بازار اختیارهای معامله (Options Markets)
چگونه بفهمیم آیا ژورنالی ISI است؟ ایمپکت فاکتور دارد یا خیر؟
وظایف مدیر Manager Tasks.
مدیریت مالی و اقتصاد مدیریت موضوع : نقطه سر به سر زمستان 93
فصل دوم جبر بول.
بررسی قطبش در لیزر های کاواک عمودی گسیل سطحی(vcsel)
VALUE ADDED TAX. VALUE ADDED TAX چیدمان ارائه : 1.تعریف مالیات 2.انواع مالیات 3.هدف از مالیات 4.مالیات در دولت ایران از قبل تا کنون 5.مفهوم مالیات.
مقدمه اي بر مهندسي نيازمنديها
Ali Karimpour Associate Professor Ferdowsi University of Mashhad
SSO Single Sign-on Systems
آموزش و یادگیری Education and Training
1.
آموزش کرک کردن نرم افزار ACTIVE HDL
Tree Sort.
کوئیز از جلسه قبل) کارخانه ای در حال خرید قطعه‌ای برای یکی از ماشین‌آلات خود می باشد اگر نرخ بهره 10% برای محاسبات فرض شود، دو مدل از قطعه ماشین در دسترس.
مدارهای منطقی فصل سوم - خصوصیات توابع سويیچی
مقدمه: در فصل قبل بر این نکته تاکید شد که تقاضا برای کالاهای تولیدی نقش مهمی را در بسیاری از تصمیمات تجاری ایفا می کند.براب استفاده از روابط حاکم.
دینامیک سیستمهای قدرت مدرس: دکتر مهدی بانژاد
تهیه و تنظیم: فاطمه قاسمی دانشگاه صنعتی شریف – پاییز 86
فضای نمونه: مجموعه همه برآمدهای ممکن یک آزمایش را فضای نمونه گویند . واقعه (پیشامد) : هر زیر مجموعه از فضای نمونه را پیشامد گویند . پیشامدها با حروف بزرگ.
Bucket sort اكرم منوچهري زهرا منوچهري
Ali Karimpour Associate Professor Ferdowsi University of Mashhad
آشوب در سیستمهای دینامیکی
بسم الله الرحمن الرحیم هرس درخت تصمیم Dr.vahidipour Zahra bayat
جستجوی منابع الکترونیک
Angular Kinetics مهدی روحی بهار 85.
فصل ششم مدارهای ترتیبی.
سخت افزارهای امنیتی Hardware Security تهیه و ارایه : یونس جوان.
Uniprocessor Scheduling
توزیع میانگین نمونه سعید موسوی.
به نام یکتای دانا فصل اول: متدها و قواعد.
فصل 8 –Process and Deployment
برنامه ریزی خطی پیشرفته (21715( Advanced Linear Programming Lecture 7
مباني كامپيوتر و برنامه سازي Basics of Computer and Programming
مباني كامپيوتر و برنامه سازي Basics of Computer and Programming
ساختمان داده ها گرافها.
Presentation transcript:

اتخاذ تصمیم عقلانی بصورت توزیع شده

آزمایشگاه سیستمهای هوشمند 2 رئوس مطالب ویژگی های مکانیسم اتخاذ تصمیم مزایده ( حراج ) پارامترهای مزایده انواع مزایده حراج English حراج Dutch حراج های قیمت اول و Sealed bid حراج Vickrey مذاکره ابعاد مذاکره مذاکره در دامنه های وظیفه محور پروتکل اعطای یکنواخت استراتژی Zeuthen

آزمایشگاه سیستمهای هوشمند 3 رئوس مطالب ( ادامه ) مذاکره در دامنه های ارزش محور بحث بحث بر مبنای منطق مکالمه

آزمایشگاه سیستمهای هوشمند 4 اتخاذ تصمیم عقلانی بصورت توزیع شده چگونه وقتی عامل ها دارای نفع شخصی هستند به توافق می رسند؟ در افراطی ترین حالت ( مثلا در مواجهات zero sum) نمی توان به توافقی رسید اما در عمل، در بیشتر حالات امکان رسیدن به توافق دو طرفه در مورد مسائل مورد علاقه دو طرف وجود دارد. دو قابلیت برای عامل جهت رسیدن به توافق حیاتی است : مذاکره (negotiation) مزایده (auction, argumentation)

آزمایشگاه سیستمهای هوشمند 5 مکانیسم ها، پروتکل ها و استراتژی ها مذاکره توسط یک مکانیسم یا پروتکل خاص کنترل می شود. مکانیسم در واقع قوانین مواجهه را بین عامل ها تعریف می کند. طراحی مکانیسم یعنی طراحی روش هایی که ویژگی های دلخواهی را ارضا می کنند. فرض کنید یک پروتکل خاص داده شده است. چگونه می توان یک استراتژی برای یک عامل خاص طراحی کرد؟

آزمایشگاه سیستمهای هوشمند 6 طراحی مکانیسم ویژگی های مورد انتظار یک مکانیسم همگرایی / تضمین موفقیت : یعنی در پایان حتما توافق حاصل شود. حداکثر کردن رضایت اجتماعی (social welfare) : یعنی جمع سودمندی (utility) تمامی شرکت کنندگان حداکثر شود. Pareto efficiency : نتیجه یک مذاکره Pareto efficient است اگر هیچ نتیجه دیگری وجود نداشته باشد که در آن یک عامل بیشتر سود کند بدون این که هیچ عامل دیگری ضرر کند. یعنی اگر نتیجه یک مذاکره Pareto efficient نباشد آن گاه در آن نتیجه ای وجود دارد که در آن حداقل یک عامل می تواند سود کند در حالی که سایر شرکت کنندگان در مذاکره را بدون ضرر دادن به آنها همچنان راضی نگه می دارد. عقلانیت فردی : یعنی این که تابعیت از قوانین مکانیسم بهترین علاقه مندی (best interest) برای شرکت کنندگان آن محسوب شود. اگر مکانیسمی دارای این ویژگی نباشد انگیزه و دلیلی برای شرکت در آن برای عامل ها وجود نخواهد داشت.

آزمایشگاه سیستمهای هوشمند 7 طراحی مکانیسم ( ادامه ) ثبات (stability) : یک پروتکل دارای ثبات است اگر برای تمامی عامل های شرکت کننده در آن باعث شود که به طریق خاصی رفتار کنند. مثل حالت توازن Nash سادگی : یک پروتکل، ساده است اگر با استفاده از آن یک شرکت کننده به آسانی بتواند استراتژی بهینه را تعیین کند. توزیع شدگی : یعنی پروتکل طوری طراحی شود که نقطه خرابی مرکزی (single point of failure) نداشته باشد و ارتباطات بین عامل ها را حداقل کند.

آزمایشگاه سیستمهای هوشمند 8 مزایده مزایده ( حراج ) بین یک عامل به نام دلال حراج (auctioneer) و مجموعه ای از عامل ها به نام پیشنهاد کننده یا خرید کننده (bidder) انجام می گیرد. هدف مزایده برای دلال حراج تخصیص کالا به یکی از پیشنهاد دهندگان است. در بیشتر موارد دلال حراج انتظار دارد که قیمت کالا را به حداکثر برساند در حالی که پیشنهاد دهندگان انتظار دارند قیمت کالا را حداقل کنند.

آزمایشگاه سیستمهای هوشمند 9 پارامترهای مزایده کالاها می توانند دارای ارزش خصوصی (private) باشند. یعنی مثلا کالا برای تعدادی از عامل ها ارزشمند تر است. دارای ارزش عمومی (public/common) باشند. یعنی آن کالا برای تمامی پیشنهاد دهندگان ارزش یکسانی دارد. دارای ارزش وابسته (correlated) باشد. یعنی ارزش کالا برای یک عامل هم بستگی به عوامل خصوصی خود عامل و هم بستگی به ارزش آن کالا برای سایر عامل ها دارد. تعیین برنده مزایده می تواند اولین قیمت (first price) باشد. یعنی عاملی که بیشترین قیمت را می دهد برنده است و کالا را به همان قیمتی که پیشنهاد کرده است می خرد. دومین قیمت (second price) باشد. یعنی عاملی که بیشترین قیمت را پیشنهاد کرده است، کالا را به مقدار دومین قیمت بالای پیشنهادی می خرد.

آزمایشگاه سیستمهای هوشمند 10 پارامترهای مزایده ( ادامه ) پیشنهادات ممکن است Open cry باشد. یعنی عامل ها از مقادیر پیشنهادی یکدیگر اطلاع دارند. Sealed bid باشد. یعنی هر عامل از قیمتی که سایر عامل ها پیشنهاد می کنند اطلاع ندارد. پیشنهاددهی ممکن است یکباره ای (one shot) باشد. یعنی همه عاملها در یک مرحله پیشنهاد می دهند و سپس دلال حراج کالا را به برنده می دهد. بالا رونده (ascending) باشد. یعنی حراج با پیشنهاد قیمت پایین شروع می شود و سپس پیشنهاد های بعدی هر کدام قیمت بالاتری نسبت به قبل ارائه می دهند. پایین رونده (descending) باشد. یعنی دلال حراج با یک قیمت بالا شروع می کند و در مراحل بعدی حراج قیمت های پایین تری را پیشنهاد می کند.

آزمایشگاه سیستمهای هوشمند 11 حراج English معمول ترین نوع حراج می باشد اولین قیمت Open cry بالا رونده استراتژی غالب (dominant strategy) برای یک عامل آن است که پیاپی قیمتی کمی بیشتر از بالاترین پیشنهاد جاری، در مرحله بعد پیشنهاد کند و وقتی به حداکثر قیمتی که می خواهد بپردازد رسید دست نگه دارد. آسیب پذیر در برابر Winner ’ s curse: اگر پیشنهاد دندگان اطلاع دقیقی از ارزش کالای پیشنهادی نداشته باشند، ممکن است برنده برای یک کالای کم ارزش پول زیادی بپردازد. عوامل نفوذی (shills). یعنی دلال حراج عاملی را در میان عاملهای پیشنهاد دهنده برای فریب آنها قرار دهد.

آزمایشگاه سیستمهای هوشمند 12 حراج Dutch ویژگی های زیر را دارد Open cry پایین رونده نحوه عمل : دلال حراج با یک قیمت بالای ساختگی شروع می کند. دلال حراج در هر مرحله قیمت پیشنهادی را پایین می آورد تا این که عاملی حاضر شود کالا را به آن قیمت بخرد. سپس کالا به عاملی که حاضر به خرید کالا با آن قیمت شده، اختصاص داده می شود.

آزمایشگاه سیستمهای هوشمند 13 حراج های قیمت اول و Sealed bid این حراج ها حراج های یکباره ای هستند فقط یک مرحله وجود دارد پیشنهاد دهندگان یک پیشنهاد مخفیانه برای کالا می کنند کالا به عاملی که بالاترین قیمت را پیشنهاد کرده است، اختصاص می یابد. برنده به همان قیمتی که پیشنهاد کرده است، کالا را می خرد. بهترین استراتژی دادن پیشنهادی کمتر از مقدار حقیقی ای است که می خواهیم برای آن کالا بپردازیم

آزمایشگاه سیستمهای هوشمند 14 حراج Vickrey این حراج ها قیمت دوم هستند Sealed bid می باشند. کالا به عاملی که بالاترین پیشنهاد را داده، به قیمت بالاترین پیشنهاد دوم فروخته میشود. استراتژی غالب، پیشنهاد همان مقدار واقعی ای است که می خواهیم برای کالا بپردازیم در معرض رفتار ضداجتماعی (antisocial) قرار دارد : فرض کنید A و B دو عامل پیشنهاد کننده برای کالای G می باشند. A حداکثر 90 دلار می خواهد برای G پرداخت کند و B 100 دلار اگر A قیمت واقعی خود را بخواهد پیشنهاد کند آنگاه B حراج را با قیمت 90 دلار می برد A می تواند همچنان ببازد، اما B را تنبیه کند ! به این صورت که مثلا پیشنهاد 99 دلار را برای G بدهد.

آزمایشگاه سیستمهای هوشمند 15 دروغ گفتن و تبانی پروتکل های گوناگون حراج، در معرض دروغ گفتن از طرف دلال حراج، و تبانی از جانب پیشنهاد دهندگان می باشند. در تمامی چهار نوع حراج قبل، پیشنهاد دهندگان می توانند تبانی کنند. برای بالا بردن پیشنهاد ها، می توان از عوامل نفوذی استفاده کرد !

آزمایشگاه سیستمهای هوشمند 16 مذاکره مزایده ها فقط با اختصاص کالا سر و کار دارند. برای رسیدن به توافق به تکنیک های پیشرفته تری یعنی مذاکره نیاز داریم. مذاکره فرآیند رسیدن به توافق در مورد موضوعات مورد علاقه مشترک می باشد. هر سناریوی مذاکره چهار مولفه دارد : یک مجموعه ی مذاکره (negotiation set) : پیشنهادهای (proposal) ممکنی که عامل ها می توانند بدهند. یک پروتکل برای هر عامل یک استراتژی لازم است که از بقیه مخفی می باشد. قانونی که نشان دهد چه موقع توافق حاصل می شود و چه چیزی توافق است مذاکره معمولا در یک سری مرحله انجام می شود که در هر مرحله یک عامل پیشنهاد می دهد.

آزمایشگاه سیستمهای هوشمند 17 مذاکره ( ادامه ) تقسیم بندی مذاکرات از نظر تعداد ویژگی (attribute) های مورد مذاکره تک موضوعی (single issue): نسبت به عاملها متقارن (symmetric) است. یعنی اگر یک نتیجه برای یک عامل ترجیح داشته باشد، آنگاه برای عامل دیگر ترجیح کمی دارد. مثال : دو عامل فقط روی قیمت یک کالا مشغول مذاکره باشند. چند موضوعی (multiple issue): در این گونه مذاکرات، عاملها بجای مذاکره بر روی ارزش تنها یک ویژگی، بر روی ارزشهای چند ویژگی مشغول مذاکره هستند. مثال : خرید یک ماشین که عوامل مختلفی مانند قیمت، مدت گارانتی، تجهیزات مختلف آن مانند ضبط صوت، سیستم تهویه و... در مذاکره دخیلند. مذاکرات چند موضوعی دارای فضای حالات پیشنهاد نمایی هستند. مثلا اگر n متغیر بولی داشته باشیم حالت امکان پذیر است. یا اگر هر متغیر بتواند m مقدار بگیرد حالت امکان پذیر است. بنابراین نمی توان تمامی حالات را بررسی کرد. مثال های دنیای واقعی : مذاکرات گرفتن وام، مذاکرات سیاسی،...

آزمایشگاه سیستمهای هوشمند 18 مذاکره ( ادامه ) تقسیم بندی مذاکرات از نظر نوع تعامل عاملها در مذاکره : یک به یک (one-to-one): هر عامل فقط با یک عامل مذاکره می کند. مثل خرید یک ماشین چند به یک (many-to-one): یک عامل در آن واحد با چندین عامل در حال مذاکره است. مانند حراج ها چند به چند (many-to-many): چندین عامل در آن واحد مشغول مذاکره با چندین عامل دیگر می باشند. با داشتن n عامل در بدترین حالت n(n-1)/2 رشته (thread) مذاکره خواهیم داشت.

آزمایشگاه سیستمهای هوشمند 19 مذاکره در دامنه های وظیفه محور (Task Oriented Domains) چندین وظیفه وجود دارند. آنها را هوشمندانه طوری توزیع کنید که فعالیت هر عامل مینیمم شود. مثال : دو بچه ی 1 و 2 باید به مدرسه برده شوند. نان و پنیر باید از سوپرمارکت خریده شود. یک توزیع خوب : عامل مادر بچه ها را به مدرسه می برد. عامل پدر نان و پنیر می خرد. یک توزیع بد : عامل مادر بچه ی 1 را به مدرسه می برد و نان می خرد، عامل پدر بچه ی 2 را به مدرسه می برد و پنیر می خرد. یک TOD با یک سه تایی تعریف می شود : T یک مجموعه متناهی از وظایف ممکن است Ag={1,2, …,n} یک مجموعه متناهی از عامل ها است تابع هزینه که هزینه اجرای یک مجموعه از وظایف را نشان می دهد.

آزمایشگاه سیستمهای هوشمند 20 مذاکره در دامنه های وظیفه محور ( ادامه ) تابع هزینه باید شرایط زیر را ارضا کند : یکنوایی : هزینه انجام ” هیچ کار “ صفر است. c( ∅ )=0 مواجهه (encounter) در TOD ، یک مجموعه از وظایف است که در ابتدا به هر عامل نسبت داده شده است : از این پس خود را به دو عامل محدود می کنیم : Ag={1,2} یک Deal عبارت است از یک تقسیم وظایف جدید، یعنی تقسیم وظایف بین عاملهای 1 و 2. δ= هزینه ی عامل i از deal: سودمندی عامل i از deal: utilityi(δ)= c(Ti) - c(Di)

آزمایشگاه سیستمهای هوشمند 21 مذاکره در دامنه های وظیفه محور ( ادامه ) اگر در مواجهه ی ، نتوان هیچ deal ای پیدا کرد آنگاه عاملها باید اعمال اولیه خود یعنی را انجام دهند. Θ= را conflict deal می نامیم. می گوییم δ 1 بر δ 2 مسلط است δ1 ≻ δ2 اگر : برای هر عامل، δ 1 حداقل به خوبی δ 2 باشد. برای برخی از عاملها، δ 1 بهتر از δ 2 باشد. می گوییم δ 1 بر δ 2 بطور ضعیف مسلط است δ1 ≽ δ2 اگر حداقل شرط اول برقرار باشد.

آزمایشگاه سیستمهای هوشمند 22 مذاکره در دامنه های وظیفه محور ( ادامه ) Deal هایی که deal های دیگر بر آنها مسلط نیستند، pareto optimal می باشند یعنی حداقل به یک عامل سود می رسانند در حالی که سایرین را همچنان راضی نگه می دارند. Deal ای که بطور ضعیف بر conflict deal مسلط است، عقلانی فردی (individual rational) است. اگر یک deal ، عقلانی فردی نباشد آنگاه در آن حداقل یک عامل از انجام همان وظیفه اولیه خود ( یعنی در حالت conflict deal) راضی است. مجموعه مذاکره یا مجموعه پیشنهادات مشروع تمام deal هایی هستند که pareto optimal و عقلانی فردی می باشند.

آزمایشگاه سیستمهای هوشمند 23 مذاکره در دامنه های وظیفه محور ( ادامه ) مجموعه مذاکره individual rational deals in quarter circle area B-C-E

آزمایشگاه سیستمهای هوشمند 24 پروتکل اعطای یکنواخت ( Monotonic Concession Protocol) پروتکل اعطای یکنواخت مذاکره در یک سری از مراحل انجام می شود. در صورتی توافق حاصل می شود که عامل 1 و عامل 2 deal های δ 1 و δ 2 را ارائه کنند بطوری که برای هر عامل پیشنهاد عامل دیگر حداقل به خوبی آن عامل باشد. یعنی utility1(δ1) ≥ utility2(δ2) یا utility2(δ1) ≥ utility1(δ2) Deal سودمندی بیشینه انتخاب می شود ( اگر برابر باشند یک عدد تصادفی ) اگر هیچ یک از دو عامل قادر به ارائه ی یک پیشنهاد مشروع نباشد، آنگاه conflict deal انتخاب می شود.

آزمایشگاه سیستمهای هوشمند 25 پروتکل اعطای یکنواخت ( ادامه ) پروتکل توسط عاملهای شرکت کننده قابل تصدیق (verifiable) است تضمین می شود که مذاکره پس از یک تعداد متناهی از مراحل پایان می یابد. توافق یا حاصل می شود و یا نمی شود. مذاکره می تواند خیلی طول بکشد. چون اگر T اجتماع T 1 و T 2 باشد آنگاه 2 T حالت ممکن برای deal ها بوجود می آید. اما استراتژی خوب برای یک عامل در MCP چیست؟ استراتژی Zeuthen

آزمایشگاه سیستمهای هوشمند 26 استراتژی Zeuthen سوالات : با استفاده از MCP اولین پیشنهاد عامل چه باید باشد؟ در یک مرحله ی داده شده : چه کسی باید واگذار کند؟ اگر عامل بخواهد واگذار کند : چه مقدار باید واگذار کند؟ پاسخ ها اولین پیشنهاد : deal ای که برای او بالاترین ارجحیت را دارد ( نقاط B و C) چه کسی باید واگذار کند؟ ریسک هر عامل را در مرحله ی داده شده حساب کنید ( اسلاید بعدی )

آزمایشگاه سیستمهای هوشمند 27 استراتژی Zeuthen ( ادامه ) ریسک عامل i در مرحله ی t : risk t i = مقدار سودمندی ای که با واگذار کردن و پذیرفتن پیشنهاد از دست می دهد ij مقدار سودمندی ای که با واگذار نکردن از دست می دهد i since utility(Θ)=const we can set utility i (Θ)=0 so that چه کسی باید واگذار کند؟ عامل با ریسک کمتر

آزمایشگاه سیستمهای هوشمند 28 استراتژی Zeuthen ( ادامه ) چه مقدار باید واگذار شود؟ مقداری که آن قدر کافی باشد که توازن ریسک را در مرحله بعدی تغییر دهد. اگر مقدار کافی واگذار نشود آنگاه در مرحله ی بعد همان عامل مجبور خواهد بود که دوباره واگذار کند که کارایی را کم می کند. اگر مقدار بیش از حد واگذار شود آنگاه به از دست رفتن سودمندی منجر می شود. بسط دادن استراتژی Zeuthen در صورت داشتن ریسک های مساوی : بصورت تصادفی یک عامل را برای واگذار کردن انتخاب کنید.

آزمایشگاه سیستمهای هوشمند 29 ویژگی های استراتژی Zeuthen تضمین موفقیت : خیر تضمین خاتمه : بله حداکثر کردن رضایت اجتماعی : خیر Pareto optimal: اگر توافق حاصل شود، بله عقلانیت فردی : بله نقطه خرابی مرکزی : خیر ثبات : بله، استراتژی Zeuthen ( با قانون ریسک مساوی ) در موازنه Nash است. با این فرض که عامل دیگر از آن استفاده می کند، عامل نمی تواند کار بهتری غیر از این استراتژی انجام دهد.

آزمایشگاه سیستمهای هوشمند 30 فریب (Cheating) وظایف خیالی (phantom tasks) یک عامل وانمود کند که مشغول است ، در حالی که کارهای کمی دارد. یعنی وانمود کند که وظایفی دارد که در واقع آنها را ندارد. اقدام متقابل برای این عمل : وظایف قابل تصدیق (verifiable) پنهان کردن وظایف پنهان کردن وظایف از سایر عامل ها ، در حالی که آن وظایف می توانند مفید باشند.

آزمایشگاه سیستمهای هوشمند 31 مذاکره در دامنه های ارزش محور (Worth Oriented Domains) بجای توزیع وظایف، با همکاری یکدیگر به حالتی از محیط برسید که بالاترین ارزش را دارد. عاملها سعی می کنند از طریق مذاکره و اجرای برنامه های مشترک به حالت های ارزشمند برسند. یک WOD با یک سه تایی تعریف می شود : E: یک مجموعه متناهی از حالات ممکن محیط Ag={1,2, …,n} : یک مجموعه متناهی از عاملها J: برنامه های مشترک ممکن. یک برنامه ( دنباله ای از اعمال ) حالت e 1 را به حالت e 2 می برد و بصورت روبرو نشان داده می شود : c: J x Ag  ℝ تابع هزینه. c(j,i) هزینه اجرای برنامه j برای عامل i است. j: e1 ⇝ e2

آزمایشگاه سیستمهای هوشمند 32 مذاکره در دامنه های ارزش محور ( ادامه ) یک مواجهه در WOD یک زوج بصورت است. e 0 ∊ E : حالت اولیه محیط W: E x Ag  ℝ : تابع ارزش. W(e,i) ارزش حالت e محیط برای عامل i است. اگر عامل به تنهایی عمل کند و برنامه را پیدا کند آنگاه نیازی به مذاکره نیست، فقط باید را اجرا کند : در یک سیستم چندعامله : پیشرفت های آینده از طریق برنامه های مشترک امکان پذیر است، اگر در بهترین حالت مورد علاقه تقابل (conflict) رخ دهد آنگاه مذاکره انجام می شود. j i opt = argmax (W(i,e) – C(j,i)) j ∊ J: e 0 ⇝ e

آزمایشگاه سیستمهای هوشمند 33 بحث (Argumentation) مکانیسم های مذاکره ای که تاکنون دیدیم معایبی دارند : موقعیت ها را نمی توان توجیه کرد. نمی توان توضیح داد که یک توافق چگونه حاصل می شود. ( برای کسی که به عامل دستور داده که برایش کاری انجام دهد ) موقعیت ها نمی توانند تغییر کنند. تابع سودمندی تغییر نمی کند. در نتیجه انعطاف پذیر نیست. در حالی که انسانها در طول مذاکره می توانند تصمیمات خود را عوض کنند. راه حل : مذاکره بر مبنای بحث ابتدا نگاهی به انواع بحث های انسان ها می اندازیم.

آزمایشگاه سیستمهای هوشمند 34 بحث ( ادامه ) در یک سیستم چندعامله، بحث، فرآیند متقاعد کردن دیگران در مورد درستی ( یا نادرستی ) وضعیت کارها است. Gilbert چهار نوع بحث را شناسایی می کند : Logical mode : مربوط به اثبات منطقی ( در علوم، قانون و...) Emotional mode : از جذبه به احساسات استفاده می کند. مثلا ” چه احساسی داری اگر...“ Visceral mode: از جنبه های فیزیکی و اجتماعی استفاده می کند. مثلا ” من مسن تر، قوی تر... هستم از این رو آنچه می گویم درست است “ Kisceral mode: به بصیرت، عرفان و مذهب وابسته است.

آزمایشگاه سیستمهای هوشمند 35 بحث بر مبنای منطق یک اثبات برای یا برضد یک علاقه بسازید. عبارات (Sentence) را از پایگاه داده استنتاج کنید. Δ ⊢ φ مثال : اگر زیر مجموعه ی Γ از پایگاه داده برای استنتاج عبارت φ کافی باشد، به این زیرمجموعه Grounds گفته می شود. human(socrates) ∀x: human(x)  mortal(x) Δ1Δ1 mortal(socrates) φ1φ1 Δ 1 ⊢ φ 1 Γ ⊆ Δ: Γ ⊢ φ

آزمایشگاه سیستمهای هوشمند 36 بحث بر مبنای منطق ( ادامه ) به زوج ground و Sentence یعنی بحث ( بر روی Δ) گفته می شود. نابدیهی (non-trivial) نامیده می شود اگر Γ سازگار (consistent) باشد. اگر Γ سازگار باشد آنگاه هر چیزی را می توان استنتاج کرد. برای دو proposition به نام های φ, ψ می گوییم φ attacks ψ اگر φ ≡ ψ بحث می تواند به دو روش دفاع (defeat) شود : rebuts if φ2 attacks φ1 undercuts if φ2 attacks ψ for some ψ belong to Γ1

آزمایشگاه سیستمهای هوشمند 37 بحث بر مبنای منطق ( ادامه ) نمایش های مختلف از جهان بطور خودکار تناقضاتی را بین proposition ها در پایگاه داده های عاملها ایجاد می کنند. اگر proposition ها را بتوان انتقال داد آنگاه پایگاه داده های عاملها ممکن است ناسازگار شوند. می توان سلسله مراتب قابلیت پذیرش بحث ها را ایجاد کرد : A1: class of all arguments over Δ A2: class of all non-trivial arguments over Δ A3: class of all arguments over Δ with no rebutting arguments A3: class of all arguments over Δ with no undercutting arguments A3: class of all tautological arguments over Δ A1(Δ) ≼ A2(Δ) ≼ A3(Δ) ≼ A4(Δ) ≼ A5(Δ)

آزمایشگاه سیستمهای هوشمند 38 مکالمه (Dialogue) هدف ما بحث با خودمان ( یعنی بررسی سازگاری پایگاه داده ) نیست بلکه مکالمه با سایر عاملها است. یک مرحله از یک مکالمه بین دو عامل 0 و 1 یک حرکت (move) نامیده می شود. یک حرکت m ، یک زوج است یک دنباله (m 0,m 1, …,m k ) یک تاریخچه مکالمه نامیده می شود اگر agent(m 0 ) = 0 agent(m i ) = 0 iff i is even and agent(m i ) = 1 iff i is odd. (alternating dialogue) agents are not allowed to make argument twice argument(m i ) defeats argument(m i-1 )

آزمایشگاه سیستمهای هوشمند 39 مکالمه ( ادامه ) مثال : m 0 = (0, ) m 1 = (1, ) m 2 = (0, )....

آزمایشگاه سیستمهای هوشمند 40 مکالمه ( ادامه ) انواع مکالمه نوع وضعیت اولیه هدف اصلی هدف شرکت کنندگان Persuation conflict of opinions resolve the issue persuade the other Negotiation conflict of interests make a deal get the best for oneself Inquiry general ignorance growth of knowledge find a proof Deliberation need for action reach a decision influence outcome Information personal ignorance spread knowledge gain or pass seeking knowledge Eristics conflict / antagonism reaching an strike the accommodation other party Mixed various various various