آشنایی با فرایند داده کاوی در نرم افزار R گروه داده کاوی دایکه داود دوروش تابستان 6139.

Slides:



Advertisements
Similar presentations
معاونت درمان امور مامایی اردیبهشت 90. برای ثبت اطلاعات در برنامه نرم افزاری نظام مراقبت مرگ پریناتال ابتدا لازم است برنامه نرم افزار info-path وپرنیان.
Advertisements

انواع اصلی عامل ها.
فاکتورهای مهم در ایجاد یک مقاله علمی
Professor: Dr. Ahmad Abdollahzadeh Amirkabir University of Technology, Computer Engineering and Information Technology Department Intelligent Systems Laboratory.
طبقه بندی تعاریف سیستم های تصمیم یار
Definition. قانون بیز P(b|a) = P(a|b)P(b)/P(a) P(b|a) = P(a|b)P(b)/P(a) این قانون برای استنتاج آماری استفاده می شود. این قانون برای استنتاج آماری استفاده.
© 2005 Prentice Hall Inc. All rights reserved. o r g a n i z a t i o n a l b e h a v i o r e l e v e n t h e d i t i o n.
فایل پردازی در C File based Programming in C. انواع فایل متنی –سرعت بالا –حجم کمتر –امکان دسترسی تصادفی –حفظ امنیت داده ها دودویی (باینری) –امکان باز.
انواع Middleware و معرفی دو نمونه
1 Network Address Translation (NAT). 2 Private Network شبکه خصوصی شبکه ای است که بطور مستقیم به اینترنت متصل نیست در یک شبکه خصوصی آدرس های IP به دلخواه.
به نام riskسمينار آشنايي و كاربرد نرم افزار
فارسی سازی يکپارچه در سيستم عاملهای OS/390 & Windows واحد 1 مهندسی سيستم Integrated Farsi support on OS/390 & Windows.
1 بنام خدا زبان برنامه نویسی C (21814( Lecture 14 Structures.
. Various management strategies, such as the development of sanctuaries, closed seasons, minimum size-limit for harvesting of 75mm carapace length.
Data Types Modifiers Base data type Size Sign signed int 2 B unsigned float 4 B short double 8 B long char 1 B.
Eric S. K. Yu Faculty of Information Studies, University of Toronto
معماری فناوری اطلاعات چیست؟
مدیریت اطلاعات و داده های سازمان یافته
نظریه رفتار برنامه ريزي شده Theory of Planned Behavior
تمرین هفتم بسم الله الرحمن الرحیم درس یادگیری ماشین محمدعلی کیوان راد
معرفی پرتال سازمانی درسا مرکز فناوری اطلاعات و ارتباطات
آشنایی با میکروتیک عمادالدین بنگلی MTCNA.
فصل اول: رسانه های ذخیره سازی
Autumn 2014 Graphical user interface Hamid.r soofi.
دانشکده مهندسی کامپیوتر
بنام خدا زبان برنامه نویسی C (21814( Lecture 12 Selected Topics
آشنایی مقدماتی با نرم افزار Endnote X4
PACS = ( Picture Archiving and Communication System)
تحلیل و طراحی سیستم ها بخش ششم کتاب توربان.
استانداردهای تصاویر دیجیتال پزشکی با فرمت دایکام DICOM در سیستم PACS
ارائه شده: الهام قنبری فتحیه فقیه خراسانی گروه3 تابستان 85
چگونه بفهمیم آیا ژورنالی ISI است؟ ایمپکت فاکتور دارد یا خیر؟
نرم افزار نگهداری و تعمیرات مبتنی بر مدیریت دانش نت CMMS-MKMS
به نام خدا.
به نام خالق عقل و خرد ARENA ارائه دهندگان: علی کتابداری امیر پورسلطانی.
فصل دوم جبر بول.
انجمن انفورماتیک ایران سمينار
SSO Single Sign-on Systems
آموزش و یادگیری Education and Training
SE Dept.2 تهیه کنندگان: ملیحه اسکندری نسیبه پوتی
آشنایی مقدماتی با نرم افزار Endnote X4
ابزار اندازه گیری و کنترل
جزوه درس طراحی سیستمهای شی گرا
سیستم های اطلاعات مدیریت Management Information systems
ASP.NET فرناز شریعت.
خودارزیابی بهداشت دست سازمان بهداشت جهانیWHO
تهیه و تنظیم: فاطمه قاسمی دانشگاه صنعتی شریف – پاییز 86
فصل 4. فصل 4 جمع آوری نیازمندیها و تحلیل سیستم : فاز تولید هر نرم افزار با مرحله ای به نام تعریف مسئله شروع می شود. منظور از تعریف مسئله شناخت محیط.
نظریه رفتار برنامه ريزي شده Theory of Planned Behavior
آشوب در سیستمهای دینامیکی
راهنمای استفاده از ابزار Mailings در Ms Word
جلسه ششم حفاظت در سیستم عامل
نام طرح.
تدريس يار: ميثم نظرياني
آشنایی مقدماتی با نرم افزار Endnote X4
نام درس: طراحی و پیاده سازی زبانهای برنامه سازی
آشنایی مقدماتی با نرم افزار Endnote
کاربرد کامپیوتر در داروخانه
جستجوی منابع الکترونیک
به نام خدا Koha برنامه.
سمینار SharePoint رانندگی در بزرگراه پرتال ها
فصل ششم مدارهای ترتیبی.
نرم افزار عملي دوره كارداني كامپيوتر دانشگاه کردستان دانشكده فني
فرشاد آقابزرگی هوش تجاری
سخت افزارهای امنیتی Hardware Security تهیه و ارایه : یونس جوان.
به نام یکتای دانا فصل اول: متدها و قواعد.
فصل 8 –Process and Deployment
کارگاه معاملات الگوریتمی
هدف با استفاده از الگوریتم بهینه سازی کلونی مورچگان( ACO ) و قوانین سیستم فازی به تفسیرقوانین آنها میپردازیم. سپس، با بهره گیری از این قوانین، تعریف مناسبی.
به نام خدا کاظم فرزین بهار 98 معرفی Geant4 وکاربردها و قابلیت های آن نسخه ی
Presentation transcript:

آشنایی با فرایند داده کاوی در نرم افزار R گروه داده کاوی دایکه داود دوروش تابستان 6139

آشنایی با نرم افزار R بخش دوم

R Contributors R was initially written by Robert Gentleman and Ross Ihaka—also known as “R & R” of the Statistics Department of the University of Auckland. Since mid-1997 there has been a core group with write access to the R source Robert Gentleman Ross Ihaka

نقاط قوت نرم افزار R جامع ترین پکیج های تحلیل آماری در R وجود دارد. R یک زبان برنامه نویسی است که قابل توسعه می باشد و هر روز در حال توسعه بیشتر است. R قدرت گرافیکی برجسته ای دارد و با اکثر واسطهای گرافیکی ارتباط برقرار می کند. R رایگان و متن باز است و هرکسی می تواند آن را به دلخواه تغییر دهد. R هیچ محدودیت لایسنس ندارد و در هرجا و هرمکانی قابل استفاده است. R بیش از 9000 پکیج منتشر شده در موضوعات مختلف اقتصادسنجی،داده کاوی، تحلیل فضایی و اطلاعات زیستی و... در CRAN و تعداد زیادی پکیج بصورت غیر رسمی در Github دارد. R بر روی انواع نسخه های سیستم عامل های لینوکس، مک، ویندوز در نسخه های 32 و 64 بیتی قابل اجرا است. برای R گروه های پرسش و پاسخ فعالی وجود دارد و کتاب- هاو لینک های زیادی برای یادگیری R منتشر شده است. R با بسیاری از ابزارهای داده دیگر، نرم افزارهای آماری (Excel، SAS،SPSS و...)، دیتا بیس ها ( Oracle، MySql و...) و... ارتباط برقرار می کند. بهترین زبان برنامه نویسی مناسب برای شما در محیط R امکان استفاده از کدهای Cو C++ و Fortran وجود دارد و برنامه نویسان میتوانند با این زبان ها، مستقیما اشیا R را تغییر دهند.

نقاط ضعف نرم افزار R اکثر کدها و برنامه هایی که نوشته شده و منتشر شده سریع، ظریف و به آسانی قابل درک نیستند. در مقایسه بادیگر زبان های برنامه نویسی توسعه دهندگان بیشتر تمایل به تمرکز بر روی نتایج دارند تا فرایند اجرای کد. وجود تناقضات در بین برخی پکیج های منتشر شده در R در باره موضوعات مشابه بطور کلی R زبان کندی است(در اجرای پردازش های سنگین ضعیف عمل می کند) و مموری سیستم را زیاد مصرف می کند. IEEE Spectrum has just published its third annual ranking with its 2017 Top Programming Languages.

مفاهیم اولیه در R Objects Functions Arguments packages libraries Help (Description, usage, arguments, details, Value, Examples) Attributes (Names, Dim, … ) Environments Scripts options درک کسب و کار شناسایی و درک داده ها آماده سازی داده مدل سازی ارزیابی

انواع ساختارهای داده در R ماتریس(Matrics) آرایه(Array) لیست(List- recursive vector) دیتا فریم(data frames) بردارها(Atomic Vectors) a data frame is a list of vectors, data frame can have a column that is a list درک کسب و کار شناسایی و درک داده ها آماده سازی داده مدل سازی ارزیابی

انواع ساختارهای داده در R بردارها(Atomic Vectors) Integer Double Character Logical Complex NA مفهوم [ ] typeof () length () is.atomic (x) is.vector (x) مفهوم coercion factor() %/%, % table() درک کسب و کار شناسایی و درک داده ها آماده سازی داده مدل سازی ارزیابی

انواع ساختارهای داده در R ماتریس (Matrix) آرایه ها (Array) یک ساختار دوبعدی که در آن همه داده ها از یک نوع هستند آرایه ها می توانند داده ها را در بیش از 2 بعد نگهداری کنند. همه داده ها در ارایه ها از یک نوع هستند. لیست ها ((List لیست یک بردار عمومی (generic vector) است که هر عضو ان می تواند یک بردار با داده نوع منحصر بفرد باشد. مفهوم $ مفهوم [[ ]] dim is.list unlist match %/%, % table دیتافریم(dataframe) یک لیست از بردارها با طول یکسان است.معمولا برای ذخیره جداول استفاده می شود. nrow head, tail colnames درک کسب و کار شناسایی و درک داده ها آماده سازی داده مدل سازی ارزیابی

خواندن و نوشتن داده ها در R Read and write Data درک کسب و کار شناسایی و درک داده ها آماده سازی داده مدل سازی ارزیابی

Flat files درک کسب و کار شناسایی و درک داده ها آماده سازی داده مدل سازی ارزیابی

Data from Excel : “readxl”

Databases

Web