Download presentation
Presentation is loading. Please wait.
Published byMohammadi Lakanwal Modified over 6 years ago
1
د معلوماتي سیستمونو څانګه Department of Information Systems شيخ زايد پوهنتون خوست افغانستا Sheikh Zayed University, Khost, Afghanistan د ډیټا ذخیر Data Mining اوستاد : ميرويس “ تڼى ” Lecturer : Mirwais “Tanai”
2
لمړي اونۍ معرفي د استاد او محصلانو تر منځ پیژندګلوي، د مضمون په اړه د محصلانو د معلوماتو ارزونه د کورس لنډه پیژندګلوي ،ماخذونه او کورس پالیسي. د کورس اهداف او اهمیت یي. د لیکچر نوټ ویش، د ګروپونو جوړول او د کورس په اړه د محصلانو پوښتنو ته ځوابونه © میرویس تڼي د معلوماتي سیستمونو څانګه دوهم سمستر۱۳۹۵ ډیټامایننګ اول څپرکی ( عمومي معلومات ) لمړی اونۍ معرفي دوهمه اونۍ له ډیټامایننګ سره بلدتیا دریمه اونۍ د ډیتامایننګ لپاره د ډیتا ډولونه څلورمه اونی د ډیټامایننګ د سیستمونو وړتیاوې
3
د مضمون نوم Data Mining د مضمون کوډCS832 د کریډټونو تعداد۴ د مضمون ډولاساسي د درس میتودلکچر پیش شرطد ډیټابیس مضمون ماحذونه Data Mining : Concept and Techniques (The Morgan Kaufmann Series in Data Management Systems) د مضمون لنډه پیژندنه © میرویس تڼي د معلوماتي سیستمونو څانګه دوهم سمستر۱۳۹۵ ډیټامایننګ اول څپرکی ( عمومي معلومات ) لمړی اونۍ معرفي دوهمه اونۍ له ډیټامایننګ سره بلدتیا دریمه اونۍ د ډیتامایننګ لپاره د ډیتا ډولونه څلورمه اونی د ډیټامایننګ د سیستمونو وړتیاوې
4
کورس پالیسي ۲۰ فیصده کورنۍ دندې او صنفې فعالیت ۲۰ فیصده د سمستر د نیمایي ازموینه ۶۰ فیصده اخري ازموینه په اخري ازموینه کې د ګډون لپاره ۲۰ فیصده حاضري شرط ده. © میرویس تڼي د معلوماتي سیستمونو څانګه دوهم سمستر۱۳۹۵ ډیټامایننګ اول څپرکی ( عمومي معلومات ) لمړی اونۍ معرفي دوهمه اونۍ له ډیټامایننګ سره بلدتیا دریمه اونۍ د ډیتامایننګ لپاره د ډیتا ډولونه څلورمه اونی د ډیټامایننګ د سیستمونو وړتیاوې
5
اهداف دغه کورس چې د معلوماتي سیستمونو د ډیپارټمنټ د اساسی کورسونو له جملې څخه دی د ډیټا د ذخیره کولو او له ډیټاڅخه د ښې استفادې مربوط بیلابیل موضوعات د هغوی د اهمیت سره یو ځای پکې تشریح شوی دي. پدې کورس کې محصلانو ته د ډیټا د ذخیره کولو د نوو ټکنالوژیو، تخنیکونو، همدا رنګه په لوی مقدار نسبتا په غیرمنظم ډول د ذخیره شوي ډیټا څخه د استفادې د مختلفو میتودونو او د یادو میتودونو د مطالعې د مختلفو اړخونو په اړه معلومات ورکول کیږي. همدارنګه پدې کورس کې د یادو ټکنالوژیو، تخنیکونو او میتودونو د استعمال په ضرورتونو، پدې لړکې د موجودو ننګونو په اړه معلومات ځای پر ځای شوی دي تر څو د محصلانو وړتیاوې پدې اړه زیاتې کړی. © میرویس تڼي د معلوماتي سیستمونو څانګه دوهم سمستر۱۳۹۵ ډیټامایننګ اول څپرکی ( عمومي معلومات ) لمړی اونۍ معرفي دوهمه اونۍ له ډیټامایننګ سره بلدتیا دریمه اونۍ د ډیتامایننګ لپاره د ډیتا ډولونه څلورمه اونی د ډیټامایننګ د سیستمونو وړتیاوې
6
د کورس اهمیت پدې وروستیو لسیزو کې د معلوماتو د ثبت کولو وسایلو د پرمخ تګ په سبب زمونږه د ادارو، کاروباری، تعلیمی او تحقیقی مرکزونو په لور د معلوماتو یو لوی طوفان خپل مخ راګرځولی. د بشری قوې زیات قمت او د خلکو د زیات مصروفیت په سبب د اکثرو هغو ادارو کارکوونکی چې زیات معلومات له ځانه سره لری د دغو معلوماتو د بیا کتلو او د هغوی څخه د نتایجو اخیستلو لپاره وخت هم نلری. نو ځکه باید مونږ داسې لارې ولټوو چې په اتومات ډول خپل معلومات پری تحلیل، تجزیه، هغه په مختلفو ګروپونو کې ګروپ بندی، خاص معلومات د خصوصیاتو له مخې تشریح، او ډیر غیرعادی معلومات او شیان نشانی کړی شو. همدا وجه ده چې اوس ډیټامایننګ د ډیټابیس د کارکوونکو د ټولنې د تحقیق تر ټولو د زیات فعالیت ساحه ګرځیدلی او د ځینو نورو ساحو د تحقیق کوونکو لکه احصایه، د اسانې او غوره ارایی، مصنوعی ذکاوت، او ماشین زده کړی سره یو ځای پدې ساحه کې د زیاتې لاس ته راوړنو کوشش کوی. © میرویس تڼي د معلوماتي سیستمونو څانګه دوهم سمستر۱۳۹۵ ډیټامایننګ اول څپرکی ( عمومي معلومات ) لمړی اونۍ معرفي دوهمه اونۍ له ډیټامایننګ سره بلدتیا دریمه اونۍ د ډیتامایننګ لپاره د ډیتا ډولونه څلورمه اونی د ډیټامایننګ د سیستمونو وړتیاوې
7
د ډیټا د تولید د منابعو زیاتوېلی له ټولنیزو او تجارتي کړنو څخه انټرنیټ پاڼي ټولنیزې شبکې الیکترونیکي راکړه ورکړه بانکي معاملات په پلورنځیو کې په الیکترونیکي ډول د معاملاتو ثبت په اداراتو کې په الیکترونیکي شکل د ریکارډ ساتلو اسانتیاوې د علمي یا ساینسي فعالیتونو څخه په سټلایټونو کې لګیدلي له لرې نه کنرول کیدونکي سنسرونه د فضا د څیړنو لپاره استعمالیدونکي تلیسکوپونه د زده کړو، علمي تجربو، ماډلونو او ساعتری په خاطر د مجازي صحنو جوړونکي پروګرامونه د مایکرو شعاوو په مرسته د جنونو د مطالعې څخه ترلاسه شوي ډیټا په شفاخانو کې د معایناتو د ډیجیټلي وسایلو څخه راټوله شوي ډیټا په شفاخانو کې د مریضانو الیکترونیکي ثبت.... © میرویس تڼي د معلوماتي سیستمونو څانګه دوهم سمستر۱۳۹۵ ډیټامایننګ اول څپرکی ( عمومي معلومات ) لمړی اونۍ معرفي دوهمه اونۍ له ډیټامایننګ سره بلدتیا دریمه اونۍ د ډیتامایننګ لپاره د ډیتا ډولونه څلورمه اونی د ډیټامایننګ د سیستمونو وړتیاوې
9
د ډیتا د پراسیس په اړه ډیر لږ پرمخ تګ © میرویس تڼي د معلوماتي سیستمونو څانګه دوهم سمستر۱۳۹۵ ډیټامایننګ اول څپرکی ( عمومي معلومات ) لمړی اونۍ معرفي دوهمه اونۍ له ډیټامایننګ سره بلدتیا دریمه اونۍ د ډیتامایننګ لپاره د ډیتا ډولونه څلورمه اونی د ډیټامایننګ د سیستمونو وړتیاوې
11
دوهمه اونی له ډیټامایننګ سره بلدتیا ډیټا مایننګ څه شی دی ؟ د ډیټامایننګ مطالعې ته هڅوونکي ټکي د ډیتامایننګ مختلف نومونه او KDD د ډیټامایننګ د سیستمونو مختلفې برخې © میرویس تڼي د معلوماتي سیستمونو څانګه دوهم سمستر۱۳۹۵ ډیټامایننګ اول څپرکی ( عمومي معلومات ) لمړی اونۍ معرفي دوهمه اونۍ له ډیټامایننګ سره بلدتیا دریمه اونۍ د ډیتامایننګ لپاره د ډیتا ډولونه څلورمه اونی د ډیټامایننګ د سیستمونو وړتیاوې
12
د ډیټامایننګ مطالعې ته هڅوونکي ټکي د ډیتا د ذخایرو د زیاتوالي عمده سببونه –د معلوماتو د ثبت دسایلو پرمخ تګ –د یادو وسایلو د بیو کموالی د ډیټا د ذخایرو عمده ځایونه –مختلفې دولتي او شخصي ادارې، کاروباري، علمي او تحقیقي مرکزونه. په یادو ذخایرو کې د معلوماتو ډولونه –شخصی، اقتصادی، ساینسی، طبی، د مارکیټ اړوند او نور معلومات له خپل ځان سره لری. © میرویس تڼي د معلوماتي سیستمونو څانګه دوهم سمستر۱۳۹۵ ډیټامایننګ اول څپرکی ( عمومي معلومات ) لمړی اونۍ معرفي دوهمه اونۍ له ډیټامایننګ سره بلدتیا دریمه اونۍ د ډیتامایننګ لپاره د ډیتا ډولونه څلورمه اونی د ډیټامایننګ د سیستمونو وړتیاوې
13
دا چې د اقتصاد د برخې د عالمانو په وینا پر هغه څه پوهیدل چې نور پرې نه پوهیږي پر نورو زمونږ برلاسي کول تضمین کوي نو ټولو د معلوماتو د ذخایرو پلټلوته ملا تړلي. په اتومات ډول د ډیتا د ذخایرو د پلټلو ضروت –د بشري قوې د ارزښت یاتوالی ، د خلکو زیات مصروفیت او د معلوماتي ټکنالوژی پرمختګ ټول ددې سبب شوي چې خلک په اتومات ډول د معلوماتو د ذخایرو د پلټلو لارې چارې ولټولي د ډیټامایننګ په پرمختګ کې لاس لرونکي د علومومختلفې څانګې –احصایه، د غوره او اسانې ارایي مطالعه کوونکي، مصنوعي ذکاوت، ماشین زده کړې او نور. د ډیټامایننګ مطالعې ته هڅوونکي ټکي [ جریان لري ] © میرویس تڼي د معلوماتي سیستمونو څانګه دوهم سمستر۱۳۹۵ ډیټامایننګ اول څپرکی ( عمومي معلومات ) لمړی اونۍ معرفي دوهمه اونۍ له ډیټامایننګ سره بلدتیا دریمه اونۍ د ډیتامایننګ لپاره د ډیتا ډولونه څلورمه اونی د ډیټامایننګ د سیستمونو وړتیاوې
14
لاسته راوړنې –داچې د ډیتامایننګ لپاره اهداف ډیر لوړ ټاکل شوي نو ددې برخې څیړونکی اوس هم له خپل هدف څخه ډیر لرې ښکاري. –خو په نتیجه کې یی ډیر پرمخ تللی الګوریتمونه، چې د کلاسفیکیشن، کلاسټرونو جوړولو، د مختلفو متحولینو تر منځ د ارتباطاتو د پیداکولو او وړاندوینې په برخه کې یی ډیره مرسته کړی. –یاد الګوریتمونه د ډیټا د مختلفو ډولونو سره د کار کولو وړتیا لري. –پورته ټولو حقایقو ته په کتو سره د ډیټاماینګ په مطالعه کې د خلکو دلچسپی ورځ تر بلې زیاتیږی د ډیټامایننګ مطالعې ته هڅوونکي ټکي [ جریان لري ] © میرویس تڼي د معلوماتي سیستمونو څانګه دوهم سمستر۱۳۹۵ ډیټامایننګ اول څپرکی ( عمومي معلومات ) لمړی اونۍ معرفي دوهمه اونۍ له ډیټامایننګ سره بلدتیا دریمه اونۍ د ډیتامایننګ لپاره د ډیتا ډولونه څلورمه اونی د ډیټامایننګ د سیستمونو وړتیاوې
15
د ډیټامایننګ مختلف نومونه knowledge mining from data –ډیر اوږد دي knowledge mining –پدې نوم کې د ډیټا لوي معدار ته اشاره نه ده شوي –ځینې خلک ډیتامایننګ د Knowledge Discovery from Data or KDD د یوې مترافې کلمې په نظر ګوري. –ځینې خلک DM د KDD یو پړاو په نظر کې نیسي. –ځینې خلک د مایننګ مکملې پروسېته DM وایي. DM د ورته اطلاحاتو په شان موروجه معنا نه ورکوي. © میرویس تڼي د معلوماتي سیستمونو څانګه دوهم سمستر۱۳۹۵ ډیټامایننګ اول څپرکی ( عمومي معلومات ) لمړی اونۍ معرفي دوهمه اونۍ له ډیټامایننګ سره بلدتیا دریمه اونۍ د ډیتامایننګ لپاره د ډیتا ډولونه څلورمه اونی د ډیټامایننګ د سیستمونو وړتیاوې
16
Knowledge Discovery from Data or (KDD) Data cleaning –له ډیټا څخه د غیر ضروری معلوماتو لری کول ( هغه معلومات چې زمونږ څخه په غلطی پکې راوړل شوي وي. Data integration –د ډیټا د مختلفو منابعو یو ځای کول ( دغه منابع کیدی شی د معلوماتو د ذحیره کولو لپاره استعمالیدونکي د کمپیوټر مختلف پروګرامونه وي ). Data selection –د مربوطه حصوصیاتو یا معلوماتو ټاکل د راتلونکو عملیو لپاره © میرویس تڼي د معلوماتي سیستمونو څانګه دوهم سمستر۱۳۹۵ ډیټامایننګ اول څپرکی ( عمومي معلومات ) لمړی اونۍ معرفي دوهمه اونۍ له ډیټامایننګ سره بلدتیا دریمه اونۍ د ډیتامایننګ لپاره د ډیتا ډولونه څلورمه اونی د ډیټامایننګ د سیستمونو وړتیاوې
17
Data Transformation –ډیټا ته داسې شکل یا فارمیټ ورکول زمونږ لیخوا د استعمالیدونکی پروګرام لپاره مناسب وی. Data mining –هغه اساسی پروسه په کومه کې چې د ځیرکو میتودونو څخه په استفادې د معلوماتو باارزښته ټوټی په لاس راوړل کیږی. Pattern evaluation –د ډیټامایننک د پروسې څخه په لاس راغلو معلوماتو د هغو ارزښتونو په اساس ارزیابی چې مونږ پکې دلچسپی لرو. Knowledge presentation –له هغو تخنیکونو څخه په استفادې سره چې معلومات په اسانه د لیدو وړ ګرځوی او یا د ارایه کولو لپاره اسعمالیږی هغه څه چې تاسو تری زده کړی د اسعمالوونکو سره شریکول Knowledge Discovery from Data or (KDD) [ جریان لري ] © میرویس تڼي د معلوماتي سیستمونو څانګه دوهم سمستر۱۳۹۵ ډیټامایننګ اول څپرکی ( عمومي معلومات ) لمړی اونۍ معرفي دوهمه اونۍ له ډیټامایننګ سره بلدتیا دریمه اونۍ د ډیتامایننګ لپاره د ډیتا ډولونه څلورمه اونی د ډیټامایننګ د سیستمونو وړتیاوې
18
پدې اخرو وختونو کې د ډیتامایننګ نوم ډیر شهرت پیدا کړي همدغې شهرت ته په کتو مونږ پدې کورس کې ټوله پروسه د DM په نوم یادوو. زمونږ له نظره DM هغه پروسه ده چې په ډیټابیسونو، ډیتآویرهاوسونو، د ډیټا د ذخیره کولو نورو لویو منابعو کې د ذخیره شوي ډیټا څخه د دلچسپو او ارزښتمنو معلوماتو د لاسته راوړلو یا رایستلو لپاره استعمالیږی. Knowledge Discovery from Data or (KDD) [ جریان لري ] © میرویس تڼي د معلوماتي سیستمونو څانګه دوهم سمستر۱۳۹۵ ډیټامایننګ اول څپرکی ( عمومي معلومات ) لمړی اونۍ معرفي دوهمه اونۍ له ډیټامایننګ سره بلدتیا دریمه اونۍ د ډیتامایننګ لپاره د ډیتا ډولونه څلورمه اونی د ډیټامایننګ د سیستمونو وړتیاوې
19
Database or data warehouse server – داسرور وظیفه لری چې د یوزرلیخوا د ډیټامایننګ غوښتل شوی کار تر سره کړی. Knowledge base –دا د نالج هغه ډومین دی چې زمونږسرچ کویری صحیح ځای ته رهنمایی کوی او همدارنګه د معلوماتو ترلاسه شوی ټو ټی زمونږ لیخوا د ټاکل شوو ارزښتونو په رڼا کې ارزیابی کوی. یعنې هغه ټول ارزشتونه او معیارونه چې مونږ یی د ترلاسه شوو نتایجو د ارزیابی لپاره استعمالوو په همدغه برخه کې موجود وی. د ډیټامایننګ د سیستمونو مختلفې برخې © میرویس تڼي د معلوماتي سیستمونو څانګه دوهم سمستر۱۳۹۵ ډیټامایننګ اول څپرکی ( عمومي معلومات ) لمړی اونۍ معرفي دوهمه اونۍ له ډیټامایننګ سره بلدتیا دریمه اونۍ د ډیتامایننګ لپاره د ډیتا ډولونه څلورمه اونی د ډیټامایننګ د سیستمونو وړتیاوې
20
Data mining engine –د سیستم دا برخه په یو شمیر ماډیولونو باندې مشتمله وی چې د معلوماتو د کلا سیفیکشن، د معلوماتو د مختلفو برخو ترمنځ د ارتباطاتو پیژندنه، وړاندوینه، او داسې نور کارونه ترسره کوی. User interface –دا برخه د سیستم او د سیستم د استعمالوونکو ترمنځ د ارتباط د قایمولو لپاره استعمالیږی. له دغې برخې څخه د ډیټامایننګ د خاصې کویری په صادرولو سره استعمالوونکی له سیستم څخه خپلې غوښتنې کوی. د کویری په نتیجه کې د معلوماتو ترلاسه شوی ټوټې په مختلفو قسمونو ارایه کوی. د ډیټامایننګ د سیستمونو مختلفې برخې [ جاري ] © میرویس تڼي د معلوماتي سیستمونو څانګه دوهم سمستر۱۳۹۵ ډیټامایننګ اول څپرکی ( عمومي معلومات ) لمړی اونۍ معرفي دوهمه اونۍ له ډیټامایننګ سره بلدتیا دریمه اونۍ د ډیتامایننګ لپاره د ډیتا ډولونه څلورمه اونی د ډیټامایننګ د سیستمونو وړتیاوې
21
د ډیټا له ډولو نو څخه د ډیټا د ذخیره کولو د هغو منابعو ډولونه دي چې د ډیټامایننګ پروسه پرې اجرا کیدی شي. په اصولو کې خو ډیټامایننګ د ډیټا د ټولو ډولونو سره باید د کار کولو وړتیا ولری خو زمونږه د دې سمیستر هدف صرف د ډیټا پر محدودو قسمونو باندې بحث کول دي. د دې لپاره چې پدې اړه تیر درسونه مو بیرته رایاد شی پدې برخه کې پورته ذکر شوی د ډیټا دولونه یا د ډیټاد ذخیره کولومنابع هره یوه یی جدا جده تربحث لاندی نیسو. د ډیټامایننګ لپاره د ډیټا مناسب ډولونه © میرویس تڼي د معلوماتي سیستمونو څانګه دوهم سمستر۱۳۹۵ ډیټامایننګ اول څپرکی ( عمومي معلومات ) لمړی اونۍ معرفي دوهمه اونۍ له ډیټامایننګ سره بلدتیا دریمه اونۍ د ډیتامایننګ لپاره د ډیتا ډولونه څلورمه اونی د ډیټامایننګ د سیستمونو وړتیاوې
22
Relational Database management Systems –د ډیتا د ذحیره کولو تر څنګ د ډیټا د ضایع کیدو او هغه کسانو په مقابل کې چې یاد سیستم ته د داخلیدو اجازه نلری د ذحیره شوی ډیټا د امنیت کارونه هم پر غاړه لری. –ډیټا په ټیبلونو،کالمونویا fields ، روګانو یا tuples کې تنظیم کوي. –په سیستم کې هر ټیبل او په ټیبل کې هر کالم ځانګړی نوم لري. د ټیبل هره رو یا ریکارډ د یوه یا څو خاصو کالمونو په استعمال سره چې د unique key یا primary key په نوم سره یادیږي ځانګړي کوي. –مختلف ډوله ریلیشنل عملی لکه join, selection, projection وغیره پرې ډیر په اسانی سره ترسره کیدی شی. –لدې څخه علاوه د کویری په استعمال سره مونږ له ټیبلو څخه د ډیټا مختلف فرعی سیتونه یا ګروپونه په لاس راوړی شو او د ډیټا د څرنګوالی په اړه مختلفو سوالونو ته ځواب ویلی شو. –د دیټامایننګ د میتودونو څخه په استفادې سره مونږ لدې څخه علاوه ځینې نور دلچسپ معلومات لکه کوم ډول قرضدارو ته قرض ورکول له خطر سره مخامخ دی، خلک کوم ډول مواد یو ځای خریداری کوی وغیره هم ترې په لاس راوړی شو. د ډیټامایننګ لپاره د ډیټا مناسب ډولونه [ جاري ] © میرویس تڼي د معلوماتي سیستمونو څانګه دوهم سمستر۱۳۹۵ ډیټامایننګ اول څپرکی ( عمومي معلومات ) لمړی اونۍ معرفي دوهمه اونۍ له ډیټامایننګ سره بلدتیا دریمه اونۍ د ډیتامایننګ لپاره د ډیتا ډولونه څلورمه اونی د ډیټامایننګ د سیستمونو وړتیاوې
23
Data ware houses د دیټا د ساتلو هغه سیستمونه دی چې ډیټا پکې له مختلفو منابعو څخه په مختلفو شکلونو سره را یو ځای کیږی او د واحد جوړښت لاندی په یوه ځای کې ساتل کیږی. او چارې یي په لاندې پړاونو کې تر سره کیږي. – data integration ، Data cleaning ، transformation ، data loading ، data refreshing د ډیټامایننګ لپاره د ډیټا مناسب ډولونه [ جاري ] © میرویس تڼي د معلوماتي سیستمونو څانګه دوهم سمستر۱۳۹۵ ډیټامایننګ اول څپرکی ( عمومي معلومات ) لمړی اونۍ معرفي دوهمه اونۍ له ډیټامایننګ سره بلدتیا دریمه اونۍ د ډیتامایننګ لپاره د ډیتا ډولونه څلورمه اونی د ډیټامایننګ د سیستمونو وړتیاوې
24
Transactional Databases –عموما د ډیټابیس دا ډول د داسې فایلونومجموعه وي چې هر ریکارډ یی د یوې ځانګړي معاملې درلودونکوی وی. –د هرې ثبت شوی معاملې د ځانګړی کولو لپاره د ID یوه خاصه شمیره کارول کیږي او په تعقیب کې یی هغه ټول اجناس چې په معامله کې شامل وی لیکل کیږی. –د ډاول ډیټابیسونه اکثره د نورو مربوطه معلوماتولکه د معاملاتو تاریخ، د اخیستونکی ID ، د پلورونکی ID لپاره اضافی ټیبلې لری. –د دې ډول ډیتابیسونو فرق د RDB سره د nested relational structure چې وروسته به په تفصیل سره وڅیړل شی موجودیت دی. د ډیټامایننګ لپاره د ډیټا مناسب ډولونه [ جاري ] © میرویس تڼي د معلوماتي سیستمونو څانګه دوهم سمستر۱۳۹۵ ډیټامایننګ اول څپرکی ( عمومي معلومات ) لمړی اونۍ معرفي دوهمه اونۍ له ډیټامایننګ سره بلدتیا دریمه اونۍ د ډیتامایننګ لپاره د ډیتا ډولونه څلورمه اونی د ډیټامایننګ د سیستمونو وړتیاوې
25
Object-Relational Databases –دا ډول ډیټابیسونه د object-relational data model په اساس خپل کارونه ترسره کوي. –د ډیټا د دیرو معلقواو زیات شمیر قسمونوسره د کار کولو وړتیا لری چې پر زیات شمیر معلقو ابجیکټونو باندی یی کار تر یوه حده اسان کړی دی. –هر هغه څه چې مونږ یی په اړه معلومات ساتو (entity ) یو ابجیکټ ګڼل کیږی. ابجیکټونه لاندې حصوصیات لري د متحولین د اینټیټی ریلیشن شیپ او ریلیشنل ماډلونو د حصوصیاتو (attributes ) سره یو شان دی. د پیغامونو یو سیټ چې د نورو ابچیکټونو یا د دیټابیسونو د نورو قسمونو سره د افهام تفهیم لپاره ترې ګټه اخیستل کیږی. یو شمیر میتودونه چې هر میتود د یوه پیغام د پراسیس کولو لپاره ځانګړی کوډ لری د ډیټامایننګ لپاره د ډیټا مناسب ډولونه [ جاري ] © میرویس تڼي د معلوماتي سیستمونو څانګه دوهم سمستر۱۳۹۵ ډیټامایننګ اول څپرکی ( عمومي معلومات ) لمړی اونۍ معرفي دوهمه اونۍ له ډیټامایننګ سره بلدتیا دریمه اونۍ د ډیتامایننګ لپاره د ډیتا ډولونه څلورمه اونی د ډیټامایننګ د سیستمونو وړتیاوې
26
Temporal database – هغه ډیتابیسونه چې د وخت سره ارتباط درلودونکی ډیتا د پراسیس ځانګړی وړتیاوی لری. – valid time یا هغه موده له کومې مودی څخه چې یاد معلوما اعتبار لری. – transaction time یا هغه موده چې چې په ډیتابیس کې ساتل شوی معلومات پکې اعتبار لری. –دغې ډول ډیټا ته bitemporal data هم ویل کیږی. – TQuel [Snodgrass87], TSQL2 [Snodgrass95], SQL/Temporal [Snodgrass96] د ډیټامایننګ لپاره د ډیټا مناسب ډولونه [ جاري ] © میرویس تڼي د معلوماتي سیستمونو څانګه دوهم سمستر۱۳۹۵ ډیټامایننګ اول څپرکی ( عمومي معلومات ) لمړی اونۍ معرفي دوهمه اونۍ له ډیټامایننګ سره بلدتیا دریمه اونۍ د ډیتامایننګ لپاره د ډیتا ډولونه څلورمه اونی د ډیټامایننګ د سیستمونو وړتیاوې
27
Sequence database – د هغو سلسله وارو پیښو په اړه د معلوماتو د ساتلو لپاره ترې استفاده کیږی چې په ترتیب سره له یوې بلې وروسته بغیر له کوم مشخص وخت څخه رامنځته کیږی. –ځینې خلک له ځینو انټرنیټ پاڼو څخه وروسته خاصې انټرنیټ پاڼی ګوری. –ځینې خلک له ځینې شیانو څخه وروسته کوم کوم شیان اخلی. –له کومو بیولوژیکی تاغیراتو څخه وروسته د کومو نورو بیولوژیکی تاغیراتو سلسله شروع کیږی. – UniProt یي یو ښه مثال دي چې د protein sequence او genome sequencing د مختلفو پروژو اړوند معلومات پکې ساتل کیږي.protein sequence genome sequencing د ډیټامایننګ لپاره د ډیټا مناسب ډولونه [ جاري ] © میرویس تڼي د معلوماتي سیستمونو څانګه دوهم سمستر۱۳۹۵ ډیټامایننګ اول څپرکی ( عمومي معلومات ) لمړی اونۍ معرفي دوهمه اونۍ له ډیټامایننګ سره بلدتیا دریمه اونۍ د ډیتامایننګ لپاره د ډیتا ډولونه څلورمه اونی د ډیټامایننګ د سیستمونو وړتیاوې
28
Time-series database –دا ډول ډیټابیسونه د هغو ارزښتونو او پیښو د ریکارډ کولو لپاره استعمالیږی چې په یوه معلوم وخت کې په تقراری ډول بیا بیا راځی. –ښه مثالونه یی د ګدامونو د کنترول، او طبعی پیښو لکه حرارت او بادونو د څیړلو په نتیجه کې ترلاسه شوی معلومات دی. – Graphite چې په Python ژبه کې جوړ شوي، InfluxDB چې په Go ژبه کې جوړ شوي، Informix TimeSeries چې په Erlang ژبه کې جوړ شوي او RRDtool چې په C ژبه کې جوړ شوی دی ټول یي ښه مثالونه دي. د ډیټامایننګ لپاره د ډیټا مناسب ډولونه [ جاري ] © میرویس تڼي د معلوماتي سیستمونو څانګه دوهم سمستر۱۳۹۵ ډیټامایننګ اول څپرکی ( عمومي معلومات ) لمړی اونۍ معرفي دوهمه اونۍ له ډیټامایننګ سره بلدتیا دریمه اونۍ د ډیتامایننګ لپاره د ډیتا ډولونه څلورمه اونی د ډیټامایننګ د سیستمونو وړتیاوې
29
Spatial Databases –هغه ډیتابیسونه دی چې په فضایی هندسه کې د تعریف شوو ابجیکټونو سره د کار کولو لپاره په پام کې نیول شوی دی. –د ډیټا مهم ډولونه یي نقاط، خطونه او مستوی دي. –د SQL برابر شوي ورژنونه لکه GEOQL, PSQL او نوي ګرافیکي ژبه GEO-SAL هغه ژبې دي چې Spatial Databases سره استعمالیږي. –دا ډول ځینې ډیټابیسونه له دیرو معلقو ابجیکټونو سره لکه 3D او نورو سره هم د کار کولو وړتیا لری. د ډیټامایننګ لپاره د ډیټا مناسب ډولونه [ جاري ] © میرویس تڼي د معلوماتي سیستمونو څانګه دوهم سمستر۱۳۹۵ ډیټامایننګ اول څپرکی ( عمومي معلومات ) لمړی اونۍ معرفي دوهمه اونۍ له ډیټامایننګ سره بلدتیا دریمه اونۍ د ډیتامایننګ لپاره د ډیتا ډولونه څلورمه اونی د ډیټامایننګ د سیستمونو وړتیاوې
30
Spatiotemporal Databases –د فاصلو او وخت سره په یوه وخت کې د کار کولو لپاره په نظر کې نیول شوی. –عام مثالونه یی د متحرکو شیانوپه اړه د معلوماتو ساتل او اپډیټ چې عموما په یوه وخت کې صرف یو ځای اشغلولی شی. –د بیسیمه مخابراتي شبکو دیټابیسونه چې ګرځنده ټلیفونونه په ډیر کم وخت کې کیدی شی خپل موقعیت ته تغیرورکړی. – Spatiotemporal object –پدې اړه ډیر کم پرمختګ شوی تراوسه معیاری او منل شوی سټنډرډونه نه دی رامنځته شوی. د ډیټامایننګ لپاره د ډیټا مناسب ډولونه [ جاري ] © میرویس تڼي د معلوماتي سیستمونو څانګه دوهم سمستر۱۳۹۵ ډیټامایننګ اول څپرکی ( عمومي معلومات ) لمړی اونۍ معرفي دوهمه اونۍ له ډیټامایننګ سره بلدتیا دریمه اونۍ د ډیتامایننګ لپاره د ډیتا ډولونه څلورمه اونی د ډیټامایننګ د سیستمونو وړتیاوې
31
Text Databases –دا هغه ډول ډیټابیسونه دی چې د هغو ابجیکټونه لپاره چې په ډیټابیس کې یی په اړه معلومات ځای پر ځای شوی دی لیکلی تشریحات موجود وی. –دغه تشریحات صرف ساده جملې نه وی بلکه اوږدې جملې یا هم پیرګرافونه وی لکه : د تولیداتو خصوصیات، د غلطیو یا د اصلاحاتو راپورونه، اخطاریه پیغامونه، د موضوعاتو په اړه د خلاصې راپورونه، یاداښتونه او یا نور اسناد. –. دا ډول ډیټابیسونه شاید خاص منظم جوړښتونه ونلری لکه انټرنیټ پاڼی چې هره یوه یی بیل بیل شکل او جوړښت ولری. ځینې یی بیا نیمه منظم جوړښتونه لری لکه د بریښنالیکونو لپاره استعمالیدونکی ډیټابیسونه ځینې یی بیا پوره منظم جوړښتونه لری لکه د کتابخانو کتلاګونه. د ډیټامایننګ لپاره د ډیټا مناسب ډولونه [ جاري ] © میرویس تڼي د معلوماتي سیستمونو څانګه دوهم سمستر۱۳۹۵ ډیټامایننګ اول څپرکی ( عمومي معلومات ) لمړی اونۍ معرفي دوهمه اونۍ له ډیټامایننګ سره بلدتیا دریمه اونۍ د ډیتامایننګ لپاره د ډیتا ډولونه څلورمه اونی د ډیټامایننګ د سیستمونو وړتیاوې
32
Multimedia Databases –د لیکل شوو، تصویری، صوتی او ویډیویی معلوماتو د ساتلو لپاره استعمالیږی. –دا ډول ډیټابسونه په هغو سیستمونو کې چې د عکس له مخې معلومات اکسیس کوی، voice mail سیستمونو، video-on-demand سیستمونو، انټرنیټ پاڼو، په هغو speech-based user interface کې چې د صوتی کمانډونو د قبلولو وړتیا ولری استعمالیږی. –ځینې خصوصیات لکه د معلوماتو د ذخیره کولو لپاره د زیات ځای ضرورت او نور دا ډول ډیټابسونه له – نور څخه بیلوی. –د ډیتا د مختلفو ډولونو مقایسه : د ډیټامایننګ لپاره د ډیټا مناسب ډولونه [ جاري ] © میرویس تڼي د معلوماتي سیستمونو څانګه دوهم سمستر۱۳۹۵ ډیټامایننګ اول څپرکی ( عمومي معلومات ) لمړی اونۍ معرفي دوهمه اونۍ له ډیټامایننګ سره بلدتیا دریمه اونۍ د ډیتامایننګ لپاره د ډیتا ډولونه
33
Heterogeneous Databases –دا هغه اتومات یا نیمه اتومات سیستمونه دي چې د څو غیر متجانسو او مختلفو DMS له یو ځاي کولو څخه منځته راځي او د کویري د یوه واحد انټرفیس درلودونکی وي. –عناصر یی ددې لپاره چې له یوه بل سره معلوما تبادله کړی او مختلفو کویری ګانو ته ځواب ووایی له یوه بل سره د ارتباط نیولو وړتیا لری. Heterogeneity Technical heterogeneity – Different file formats, access protocols, query languages etc. Data model heterogeneity – Different ways of representing and storing the same data. Table decompositions, column names, data encoding schemes etc. – د ډیټامایننګ لپاره د ډیټا مناسب ډولونه [ جاري ] © میرویس تڼي د معلوماتي سیستمونو څانګه دوهم سمستر۱۳۹۵ ډیټامایننګ اول څپرکی ( عمومي معلومات ) لمړی اونۍ معرفي دوهمه اونۍ له ډیټامایننګ سره بلدتیا دریمه اونۍ د ډیتامایننګ لپاره د ډیتا ډولونه څلورمه اونی د ډیټامایننګ د سیستمونو وړتیاوې
34
Data Streams –زیات شمیر پروګرامونه د یوه نوی ډول ډیټا (stream data ) د رامنځته کولو او انالیز کولو وړتیا لري. –دا ډول ډیټا پروګرامونوته ډیټا په مسلسل او ډینامیک ډول له یوې خوا څخه ورداخلیږی او له بلې خوا ترې خارجیږی. –په عین وخت کې ترې صرف یو یا په محدود شمیر کې څارنه کیدی شی د څارنې نتایج هم باید په عین وخت برابر کړلی شی. د ډیټامایننګ لپاره د ډیټا مناسب ډولونه [ جاري ] © میرویس تڼي د معلوماتي سیستمونو څانګه دوهم سمستر۱۳۹۵ ډیټامایننګ اول څپرکی ( عمومي معلومات ) لمړی اونۍ معرفي دوهمه اونۍ له ډیټامایننګ سره بلدتیا دریمه اونۍ د ډیتامایننګ لپاره د ډیتا ډولونه څلورمه اونی د ډیټامایننګ د سیستمونو وړتیاوې Data Streams
35
Websites که د کتونکو لیخوا په کتل شوو انټرنیټ پاڼو او د دغو انټرنیټ پاڼو تر منځ د رابطې په پیدا کول وپوهیږو نو د یوه ښه سیستم ډیراین کول او د انټرنیټ پاڼو کتونکو ته د هغوی دخوښې اعلاناتو د وړاندې کولو کار ډیر اسانه شی. د ډیټا مایننګ دا برخه د Web usage mining یا Weblog mining په نوم سره یادیږی. خو څرنګه چې انټرنیټ پاڼی کوم شریک او منظم جوړښت نلری نو د کمپیوټر لپاره د دوی ترمنځ د ځانګړو اړیکو پیدا کول اسان کار نه دی. د ډیټامایننګ لپاره د ډیټا مناسب ډولونه [ جاري ] © میرویس تڼي د معلوماتي سیستمونو څانګه دوهم سمستر۱۳۹۵ ډیټامایننګ اول څپرکی ( عمومي معلومات ) لمړی اونۍ معرفي دوهمه اونۍ له ډیټامایننګ سره بلدتیا دریمه اونۍ د ډیتامایننګ لپاره د ډیتا ډولونه
36
Descriptive mining هغه ټول فعالیتونه چې د ډیټابیسونو د ابجیکټونو ترمنځ د روابطو له پیدا کولو او تشریح کولو سره تړاو لري. Predictive mining هغه ټول فعالیتونه چې له موجوده ډیتا څخه د زده کړې په مرسته د راتلونکي په اړه د وړاندوینې لپاره ترسره کیږي. ننګونې –د ډیټامایننګ سیستمونه باید په عین وخت کې د مختلفو نتایجو د پیداکولو وړتیا ولری. –په مختلفو اندازو د نتایجو د تشریح کولو وړتیا ولري. د ډیتامایننګ د سیستمونو وړتیاوې © میرویس تڼي د معلوماتي سیستمونو څانګه دوهم سمستر۱۳۹۵ ډیټامایننګ اول څپرکی ( عمومي معلومات ) لمړی اونۍ معرفي دوهمه اونۍ له ډیټامایننګ سره بلدتیا دریمه اونۍ د ډیتامایننګ لپاره د ډیتا ډولونه څلورمه اونی د ډیټامایننګ د سیستمونو وړتیاوې
37
اصطلاحات – Class –کمپیوټری وسایل په یوه پلورنځي کې د خرڅیدونکو سامانونو یو کلاس دی – Concept که مشتریان په دوه ډلو یعنې د برقی سامان الاتو لپاره د محدودې بودیجې لرونکی او د غیر محدودې بودیجې لرونکو وویشو نو د دغو ډلو لپاره کاریدونکی هر نوم یو concept بللی شو. – concept/class description هغه څه چې دغه بیلا بیل کلاسونه او concept تشریح کوی. – Characterization د کلاس د عناصرو د شریکو خصوصیاتو پیدا کول یا د target کلاس د عناصرو بیان. د ډیتامایننګ د سیستمونو وړتیاوې [ جاري ] © میرویس تڼي د معلوماتي سیستمونو څانګه دوهم سمستر۱۳۹۵ ډیټامایننګ اول څپرکی ( عمومي معلومات ) لمړی اونۍ معرفي دوهمه اونۍ له ډیټامایننګ سره بلدتیا دریمه اونۍ د ډیتامایننګ لپاره د ډیتا ډولونه څلورمه اونی د ډیټامایننګ د سیستمونو وړتیاوې
38
اصطلاحات ( جاري ) – Data Discrimination د مختلفو کلاسونو تر منځ د توپیرونو د پیدا کولو عملیه – Contrasting classes هغه کلاسونه چې له یو بل سره د پرتله کولو لپاره په نظرکې نیول کیږي. –یادونه کله کله دواړه کارونه یوځاي ترسره کیږي یعنې لمړي د Characterization په مرسته د عناصرو ترمنځ شریک خوصوصات پیدا کوي او د شریکو خصوصیاتو درلودونکو عناصرو څخه مختلف کلاسونه جوړوي او بیا یاد کلاسونه له یوبل سره مقایسه کوي کله کله د دغو دواړو کارونو په یو ځاي ترسره کول هم د Data Discrimination په نوم یادیږي. د ډیتامایننګ د سیستمونو وړتیاوې [ جاري ] © میرویس تڼي د معلوماتي سیستمونو څانګه دوهم سمستر۱۳۹۵ ډیټامایننګ اول څپرکی ( عمومي معلومات ) لمړی اونۍ معرفي دوهمه اونۍ له ډیټامایننګ سره بلدتیا دریمه اونۍ د ډیتامایننګ لپاره د ډیتا ډولونه څلورمه اونی د ډیټامایننګ د سیستمونو وړتیاوې
39
Patterns Mining – Frequent Patterns هغه معلومات چې د یوګروپ شیانو په یو ځاي د پیر یا پلور په اړه وي او د هغو شیانو مجموعه چې یوځاي پلورل کیږي د frequent items set په نوم سره یادیږي. – sequential patterns په مکرر ډول د تکراریدونکو سلسلو په اړه وړاندې شوي معلومات. – structured patterns د اشکالو د یوې برخې یا substructure لکه ګراف، ټری او یا هم شبکې په مقرر ډول تقراریدل. یادونه : د دې ډول تکراری اشکالو پیدا کول زمونږ سره مرسته کوی چې د ډیټا یا پیښو ترمنځ په زړه پورې ارتباطات پیدا کړی شو. د ډیتامایننګ د سیستمونو وړتیاوې [ جاري ] © میرویس تڼي د معلوماتي سیستمونو څانګه دوهم سمستر۱۳۹۵ ډیټامایننګ اول څپرکی ( عمومي معلومات ) لمړی اونۍ معرفي دوهمه اونۍ له ډیټامایننګ سره بلدتیا دریمه اونۍ د ډیتامایننګ لپاره د ډیتا ډولونه څلورمه اونی د ډیټامایننګ د سیستمونو وړتیاوې
40
Association Analysis په تیرو سلایډونو کې د ذکر شوو اشکالو د پښیدو د احتمالاتو د ارزونه –مثلا : – Confidence د پیښې د رامنځته کیدو احتمال – Support د ټولو پیښو ترمنځ د غوښتل شوي پیښې فیصدي. – single-dimensional rules : هغه قواعد چې یوازې د یوه خبر درلودونکی – “computer software [1%,50%]” د ډیتامایننګ د سیستمونو وړتیاوې [ جاري ] © میرویس تڼي د معلوماتي سیستمونو څانګه دوهم سمستر۱۳۹۵ ډیټامایننګ اول څپرکی ( عمومي معلومات ) لمړی اونۍ معرفي دوهمه اونۍ له ډیټامایننګ سره بلدتیا دریمه اونۍ د ډیتامایننګ لپاره د ډیتا ډولونه څلورمه اونی د ډیټامایننګ د سیستمونو وړتیاوې
41
د ډیتامایننګ د سیستمونو وړتیاوې [ جاري ] © میرویس تڼي د معلوماتي سیستمونو څانګه دوهم سمستر۱۳۹۵ ډیټامایننګ اول څپرکی ( عمومي معلومات ) لمړی اونۍ معرفي دوهمه اونۍ له ډیټامایننګ سره بلدتیا دریمه اونۍ د ډیتامایننګ لپاره د ډیتا ډولونه څلورمه اونی د ډیټامایننګ د سیستمونو وړتیاوې د کلاسونو د موندلو لارې چارې IF-THEN قواعد Decision tree او neural network
42
د ډیتامایننګ د سیستمونو وړتیاوې [ جاري ] © میرویس تڼي د معلوماتي سیستمونو څانګه دوهم سمستر۱۳۹۵ ډیټامایننګ اول څپرکی ( عمومي معلومات ) لمړی اونۍ معرفي دوهمه اونۍ له ډیټامایننګ سره بلدتیا دریمه اونۍ د ډیتامایننګ لپاره د ډیتا ډولونه څلورمه اونی د ډیټامایننګ د سیستمونو وړتیاوې Cluster Analysis کله چې مونږ د کلسټر د تحلیل او تجزیی خبره کوو نو مونږ د کلاسونو د نومونو یا د هغوی د خصوصیاتو په اړه هیڅ په ذهن کې نلرو. کمپبیوټر ته یواځی د کلسټرونو تعداد او د کلسترونو د عناصرو تر منځ د ورته والی فیصدی ښایو نور نو ټول کار کمپیوټر ته پاتې کیږی intraclass similarity زیاتوو Interclas similarity کموو هر کلسټر چې کله جوړ شی نو د عناصرو د یوه کلاس شکل غوره کوی چې هغه ټول قواعد چې د کلاسونو لپاره عملی کیدی شول د دوی لپاره هم عملی کیدی شی.
43
د ډیتامایننګ د سیستمونو وړتیاوې [ جاري ] © میرویس تڼي د معلوماتي سیستمونو څانګه دوهم سمستر۱۳۹۵ ډیټامایننګ اول څپرکی ( عمومي معلومات ) لمړی اونۍ معرفي دوهمه اونۍ له ډیټامایننګ سره بلدتیا دریمه اونۍ د ډیتامایننګ لپاره د ډیتا ډولونه څلورمه اونی د ډیټامایننګ د سیستمونو وړتیاوې
44
–په ډیتا سټ کې غیر عادي معلومات د outliers په نوم یادیږي. –په ډیتا کې د ځینو قمتونو ډیر زیاتوالي او کموالي ددې سبب کیږي چې د کلاستر د انالیز کولو او یا هم د کلاسونو جوړولو پر وخت مشکل رامنځته کوي. –په ځینو حالاتو کې لکه د درغلیو او یاد داسې کمیوزیاتیو په معلوملو کې چې پر هغوی پوهیدل زمونږ لباره ضروري وی ډیره مرسته هم کولی شی. –د outliers د معلومولو لپا ره د مختلفو احصایوی او د احتمالاتو او نور میتودونو څخه استفاده کیږی. د ډیتامایننګ د سیستمونو وړتیاوې [ جاري ] © میرویس تڼي د معلوماتي سیستمونو څانګه دوهم سمستر۱۳۹۵ ډیټامایننګ اول څپرکی ( عمومي معلومات ) لمړی اونۍ معرفي دوهمه اونۍ له ډیټامایننګ سره بلدتیا دریمه اونۍ د ډیتامایننګ لپاره د ډیتا ډولونه څلورمه اونی د ډیټامایننګ د سیستمونو وړتیاوې Outlier Analysis
45
Evolution Analysis –پدې ډول انالیز کې په مختلفو ابجیکټونو کې منظم تغیر او یا د منظم تغیر تمایل تر مطالعی لاندې نیول کیږی. –د دې ډول انالیږ د ترسره کولو لپاره د پورته یاد شوو اکثرو انالیزونو کلاس، کلستر، وړاندوینه او دروابطو انالیز څخه یو ځای استفاده کیږی. Are All of the Patterns Interesting? –د ډیتامایننګ په مرسته د تحلیل او تجزیي پورته یاد ډولونه کولی شي د ډیټا د ذخایرو څخه په زرګونو او لاکونو قواعد او نتیج روباسي، خو ټول قواعد او نتایجو په یوشان د اهمیت وړ نه وي. –د قواعدو د افادیت فیصدی د هغو الګوریتمونو په completeness پورې اړه لری چې یاد سیستمونه ترې استفاده کوی د ډیتامایننګ د سیستمونو وړتیاوې [ جاري ] © میرویس تڼي د معلوماتي سیستمونو څانګه دوهم سمستر۱۳۹۵ ډیټامایننګ اول څپرکی ( عمومي معلومات ) لمړی اونۍ معرفي دوهمه اونۍ له ډیټامایننګ سره بلدتیا دریمه اونۍ د ډیتامایننګ لپاره د ډیتا ډولونه څلورمه اونی د ډیټامایننګ د سیستمونو وړتیاوې
46
Are All of the Patterns Interesting? تر لاسه شوي قواعد او نتایج هغه وخت د اهمیت وړدي چې ( ۱ ) د انسانانو لیخوا په اسانه د پوهیدو وړ وی. ( ۲ ) پر مطلوبه ډیټا باندې یی نتایج تریوه ځایه د باور او اعتماد وړوی. ( ۳ ) په زیاتو ځایونو کې د استعمال وړ وی. ( ۴ ) په لاس راغلی نتایج نوی وی او د اسعمالوونکی سره د هغه لیخوا د وړاندې کړی شوی فرضیی په ثبوت کولو کې مرسته وکړی. د ډیتامایننګ د سیستمونو وړتیاوې [ جاري ] © میرویس تڼي د معلوماتي سیستمونو څانګه دوهم سمستر۱۳۹۵ ډیټامایننګ اول څپرکی ( عمومي معلومات ) لمړی اونۍ معرفي دوهمه اونۍ له ډیټامایننګ سره بلدتیا دریمه اونۍ د ډیتامایننګ لپاره د ډیتا ډولونه څلورمه اونی د ډیټامایننګ د سیستمونو وړتیاوې
47
Classification of Data Mining Systems د ډیتاماډلنګ له مخې –ریلیشنل، ټرانزکشنل، ابجیکټ ریلیشنل او یا هم ډیټا ویرهاوسیس مایننګ سیستمونه. د ډیتا د ډول له مخې ګروپ بندی –فضایی، time-series ، ملټی میدیا ډیټامایننګ او یا هم د انټرنیټ پاڼو د مایننګ سیستمونه د نتایجو له مخې – characterization ، discrimination ، association ، correlation ، classification ، prediction ، clustering ، outlier analysis ، evolution د ډیتامایننګ د سیستمونو وړتیاوې [ جاري ] © میرویس تڼي د معلوماتي سیستمونو څانګه دوهم سمستر۱۳۹۵ ډیټامایننګ اول څپرکی ( عمومي معلومات ) لمړی اونۍ معرفي دوهمه اونۍ له ډیټامایننګ سره بلدتیا دریمه اونۍ د ډیتامایننګ لپاره د ډیتا ډولونه څلورمه اونی د ډیټامایننګ د سیستمونو وړتیاوې
48
Classification of Data Mining Systems د نتاجو د تفصیل له مخې – generalized knowledge – primitive-level knowledge ډیتامایننګ د تخنیکونو لکه احصایوی، د ماشین زده کړی او داسې نورو له نظره هم ګروپ بندی کیدی خو د ډیټا مایینګ سیستمونه یی اکثره له یوه څخه په زیاتو تخنیکونو باندې مشتمل وی. مشکلات کیدی شی اقتصادی، مخابراتي، د DNA مربوط، او یا هم د بریښنالیکونو لپاره وی. د ډیتامایننګ د سیستمونو وړتیاوې [ جاري ] © میرویس تڼي د معلوماتي سیستمونو څانګه دوهم سمستر۱۳۹۵ ډیټامایننګ اول څپرکی ( عمومي معلومات ) لمړی اونۍ معرفي دوهمه اونۍ له ډیټامایننګ سره بلدتیا دریمه اونۍ د ډیتامایننګ لپاره د ډیتا ډولونه څلورمه اونی د ډیټامایننګ د سیستمونو وړتیاوې
49
Data Mining Task Primitives د ډیټامایننګ د کویري مختلفې برخې د task primitive په نوم یادیږي. دغه primitives د هغه سوچ یا فکر په اساس ټاکل کیږی چې استعمالوونکی یی د ډیټا د انالیز په برخه کې په ذهن کې لری. –هغه ډیټا سیټ چې باید وپلټل شی –هغه څه ډول چې مونږ یی پلټو –هغه څه چې مونږ له وړاندې نه پرې پوهیږو او د پلټلو په پروسه کې مرسته کوی ) د concept شجاره ( –د دلچسپی د اندازه. –د ارایي ډول د ډیتامایننګ د سیستمونو وړتیاوې [ جاري ] © میرویس تڼي د معلوماتي سیستمونو څانګه دوهم سمستر۱۳۹۵ ډیټامایننګ اول څپرکی ( عمومي معلومات ) لمړی اونۍ معرفي دوهمه اونۍ له ډیټامایننګ سره بلدتیا دریمه اونۍ د ډیتامایننګ لپاره د ډیتا ډولونه څلورمه اونی د ډیټامایننګ د سیستمونو وړتیاوې
50
Languages for Data mining که څه هم تر اوسه د ډیتامایننګ د کویری کومه معیاری ژبه نه ده رامنځ ته شوی خو پدې اړه تحقیق کارانو او ځینې شرکتونو ډیر پرمختګ کړی چې د دیتا مایننګ لپاره د مایکروسافټ OLE DB چې په په DMX باندې مشتمله ده د XML-style ژبه ده یادولی شو. لدې څخه علاوه PMML ( Progrmming data Model Markup Lange) او CRISP-DM (Cross-Industry Standard Process for Data Mining) هغه معیارونه دی چې پدې برخه کې ترې یادونه کولی شو. د ډیتامایننګ د سیستمونو وړتیاوې [ جاري ] © میرویس تڼي د معلوماتي سیستمونو څانګه دوهم سمستر۱۳۹۵ ډیټامایننګ اول څپرکی ( عمومي معلومات ) لمړی اونۍ معرفي دوهمه اونۍ له ډیټامایننګ سره بلدتیا دریمه اونۍ د ډیتامایننګ لپاره د ډیتا ډولونه څلورمه اونی د ډیټامایننګ د سیستمونو وړتیاوې
51
Integration of a DMS with a DB or DW System – No Coupling پدې حالت کې DM سیستم ضرورت نلری چې د DB یا DW سیستم له کوم کمانډ سره کار ولری. DMS به له یوه خاص قسم فایلونو څخه ډیټا ترلاسه کوی د ډیټا مایننګ د الګوریتمونو څخه په استفادې به یی پراسیس کوی او نتایج به په په یوه خاص ډول فایل کې ساتی. – Loose coupling پدې حالت کې د DMs داسې فرض کیږی چې د DBs او DWs ډیټا راخیستی شی او نتایج یی هم په ځانګړی فایل یا کوم DBs او WDs کې ثبت کولی شی. که څه هم دا حالت د پخوانی حالت په نسبټ یو څه ښه دی خو دا دول اکثره سیستونه د main memory په اساس کار کوی او د ډیتا په جوړښت پسې هیځ نه ګرځی چې د یوې لویی اندازی ډیتا سره کار کول ورته مشکل کوی. – Semitight coupling پدې حالت کې لدې څخه علاوه چې د DM سیستم د DB/DW له سیستم سره نښلو کیږی د ډیټا بیس او ویرهاوس په سیستمونو کې د ځینو اساسی ډیټامایننګ primitive د استعمال وړتیا هم وراضافه کیږی. – Tight coupling. پدې حالت کې د ډیتامایننګ سیستم په مکمل ډول د ډیټابیس یا ډیټاویرهاوسونو له سیستمونو سره یو ځای کیږی یو پرمختللی معلوماتي سیستم رامنځته کوی چې د ډیتا مایننګ سیستم د هغه معلوماتې سیستم د یوه فرعی کاری سیستم په څیر خپل کار سرته رسوی. د ډیتامایننګ د سیستمونو وړتیاوې [ جاري ] © میرویس تڼي د معلوماتي سیستمونو څانګه دوهم سمستر۱۳۹۵ ډیټامایننګ اول څپرکی ( عمومي معلومات ) لمړی اونۍ معرفي دوهمه اونۍ له ډیټامایننګ سره بلدتیا دریمه اونۍ د ډیتامایننګ لپاره د ډیتا ډولونه څلورمه اونی د ډیټامایننګ د سیستمونو وړتیاوې
Similar presentations
© 2025 SlidePlayer.com Inc.
All rights reserved.