فایل (word) بررسی کامل مبحث داده کاوی یا Data Mining

    —         —    

ارتباط با ما     —     لیست پایان‌نامه‌ها

... دانلود ...

 فایل (word) بررسی کامل مبحث داده کاوی یا Data Mining دارای 127 صفحه می باشد و دارای تنظیمات و فهرست کامل در microsoft word می باشد و آماده پرینت یا چاپ است

فایل ورد فایل (word) بررسی کامل مبحث داده کاوی یا Data Mining  کاملا فرمت بندی و تنظیم شده در استاندارد دانشگاه  و مراکز دولتی می باشد.

 

بخشی از فهرست مطالب پروژه فایل (word) بررسی کامل مبحث داده کاوی یا Data Mining

فهرست اشکال

فهرست جداول

فصل1: مقدمه ای بر داده کاوی

1-1 تعریف داده کاوی

2-1 تاریخچه داده کاوی

3-1 چه چیزی سبب پیدایش داده کاوی شده است؟

4-1 اجزای سیستم داده کاوی

5-1 جایگاه داده کاوی در میان علوم مختلف

6-1 قابلیتهای داده کاوی

7-1 چرا به داده کاوی نیاز داریم؟

8-1 داده کاوی چه کارهایی نمی تواند انجام دهد؟

9-1 کاربردهای داده کاوی

1-9-1 کاربردهای پیش بینی کننده

2-9-1 کاربردهای توصیف کننده

10-1 ابزارهای تجاری داده کاوی

11-1 داده کاوی و انبار داده ها

1-11-1 تعاریف انبار داده

2-11-1 چهار خصوصیت اصلی انبار داده

3-11-1 موارد تفاوت انبار داده و پایگاه  داده

12-1 داده کاوی و OLAP

1-12-1 OLAP

2-12-1 انواع OLAP

13-1 مراحل فرایند کشف دانش از پایگاه داده ها

1-13-1 انبارش داده ها

2-13-1 انتخاب داده ها

3-13-1 پاکسازی- پیش پردازش- آماده سازی

4-13-1 تبدیل داده ها

5-13-1 کاوش در داده ها (Data Mining)

6-13-1 تفسیر نتیجه

فصل 2: قوانین ارتباطی

1-2 قوانین ارتباطی

2-2 اصول پایه

1-2-2 شرح مشکل جدی

2-2-2 پیمایش فضای جستجو

3-2-2 مشخص کردن درجه حمایت مجموعه اقلام

3-2 الگوریتمهای عمومی

1-3-2 دسته بندی

2-3-2 BFS و شمارش رویداد ها

3-3-2 BFS و دونیم سازی TID-list

4-3-2 DFS و شمارش رویداد

5-3-2 DFS و دو نیم سازی TID-list

4-2 الگوریتم Apriori

1-4-2 مفاهیم کلیدی

2-4-2 پیاده سازی الگوریتم Apriori

3-4-2 معایب Apriori و رفع آنها

5-2 الگوریتم رشد الگوی تکرارشونده

1-5-2 چرا رشد الگوی تکرار سریع است؟

6-2 مقایسه دو الگوریتم Apriori و FP-growth

7-2 تحلیل ارتباطات

فصل 3: وب کاوی و متن کاوی

1-3 وب کاوی

1-1-3 الگوریتمهای هیتس و لاگسام

2-1-3 کاوش الگوهای پیمایش مسیر

2-3 متن کاوی

1-2-3 کاربردهای متن کاوی

1-1-2-3 جستجو و بازیابی

2-1-2-3 گروه بندی و طبقه بندی

3-1-2-3 خلاصه سازی

4-1-2-3 روابط میان مفاهیم

5-1-2-3 یافتن و تحلیل گرایشات

6-1-2-3 برچسب زدن نحوی (pos)

7-1-2-3 ایجاد Thesaurus و آنتولوژی به صورت اتوماتیک

2-2-3 فرایند متن کاوی

3-2-3 روشهای متن کاوی

مراجع

فهرست اشکال

1-1 مراحل فرایند کشف دانش

2-1 سیر تکاملی صنعت پایگاه داده

3-1 معماری یک نمونه سیستم داده کاوی

4-1 نرخ رشد اطلاعات

5-1 کاربرد پیش بینی کننده

6-1 داده ها از انبار داده ها استخراج می گردند

7-1 داده ها از از چند پایگاه داده  استخراج می گردند

1-2 شبکه‌ای برای

4

2-2 درخت

4

3-2 دسته بندی الگوریتمها

4-2 پایان الگوریتم Apriori

5-2 درخت الگوی تکرار

6-2 اندازه گیری کارکرد درجه حمایت برای پایگاه داده D1 40K

7-2 اندازه گیری Apriori با درجه حمایت/تراکنش

8-2 اندازه گیری FP-growth با درجه حمایت/تراکنش

1-3 مقداردهی اولیه الگوریتم HITS

2-3 مثالی از الگوهای پیمایش

3-3 فرایند متن کاوی

4-3 مثال یافتن روابط

فهرست جداول

1-2 کاوش FP-tree با ایجاد پایگاه های الگوشرطی

2-2 پارامترها

3-2 نتایج برای فاکتور درجه حمایت 5%

4-2 نتایج برای D1 150K با درجه حمایت

1-3 تراکنش های توصیف شده توسط مجموعه ای از URLها

2-3 نمایش URLها به عنوان بردارهایی از فعالیت گروه تراکنش

3-3 یک SOM مرسوم که توسط توصیف URLها تولید شده است

 
 
 
مقدمه 
امروزه با گسترش سیستم‌های پایگاهی و حجم بالای داده‌های ذخیره شده در این سیستم‌ها, نیاز به ابزاری است تا بتوان داده‌های ذخیره شده را پردازش کرد و اطلاعات حاصل از این پردازش را در اختیار کاربران قرار داد.
با استفاده از پرسش‌های ساده در SQL و ابزارهای گوناگون گزارش‌گیری معمولی, می‌توان اطلاعاتی را در اختیار کاربران قرار داد تا بتوانند به نتیجه‌گیری در مورد داده‌ها و روابط منطقی میان آنها بپردازند. امّا وقتی که حجم داده‌ها بالا باشد, کاربران هرچند زبر دست و با تجربه باشند نمی‌توانند الگوها مفید را در میان حجم انبوه داده‌ها تشخیص دهند و یا اگر قادر به این کار هم باشند, هزینه عملیات از نظر نیروی انسانی و مادی بسیار بالا است. از سوی دیگر, کاربران معمولاً فرضیه‌ای را مطرح می‌کنند و سپس بر اساس گزارشات مشاهده شده به اثبات یا رد فرضیه می‌پردازند, در حالی که امروزه نیاز به روشهایی است که اصطلاحاً به کشف دانش   بپردازند یعنی با کمترین دخالت کاربر و بصورت خودکار الگوها و رابطه‌های منطقی را بیان نمایند.
داده کاوی  یکی از مهمترین این روشها است که به الگوهای مفید در داده‌ها با حداقل دخالت کاربران شناخته می‌شوند واطلاعاتی را در اختیار کاربران و تحلیل گران قرار می‌دهند تا براساس آن تصمیمات مهم و حیاتی در سازمانها اتخاذ شوند.
اصطلاح داده کاوی زمانی بکار برده می‌شود که با حجم بزرگی از داده‌ها, در حد مگا یا ترابایت, مواجه باشیم. در تمامی منابع داده کاوی بر این مطلب تأکید شده است. هرچه حجم داده‌ها بیشتر و روابط آنها پیچیده تر باشد دسترسی به اطلاعات نهفته در میان داده ها مشکل تر می‌شود و نقش داده کاوی بعنوان یکی از روش های کشف دانش, روشن‌تر می‌گردد.
داده کاوی بطور همزمان از چندین رشته علمی بهره می‌برد نظیر: تکنولوژی پایگاه داده, هوش مصنوعی, یادگیری ماشین, شبکه‌های عصبی, آمار, الگو, سیستم‌های مبتنی بر دانش , حصول دانش , بازیابی اطلاعات , محاسبات سرعت بالا  و بازنمایی بصری داده .
1-1: تعریف داده کاوی:
اصطلاح Data Mining همانطور که از ترجمه آن به داده کاوی مشخص می شود, به مفهوم استخراج اطلاعات نهان و یا الگوها و روابط مشخص در حجم زیادی از داده‌های یک یا چند بانک اطلاعاتی بزرگ است. اطلاعات استخراج شده در تعریف Data Mining بطور ضمنی به معنی اطلاعاتی است که بر اساس آن بتوان به نتایجی دست یافت که بطور معمول ملموس نیستند. در این تعریف بر بزرگ بودن بانکهای اطلاعاتی و یا حجم زیاد داده‌های مورد پردازش تاکید می‌شود. علت این است که از نظر آماری و تئوری اطلاعات, تجزیه و تحلیل داده‌ها و یا آنطور که در این اصطلاح تعبیر می‌شود, کاوش در حجم کم داده های یک بانک به نتایج قابل قبولی منجر نمی‌شود. به کمک ابزارهای Data Mining می‌توان مقادیر متغیرهای را پیش بینی و توصیف نمود. این ابزارها در فرایندهای تصمیم‌گیری متکی بر اطلاعات و دانش   کاربر فراوان دارند و فعالیت های تجاری نوین و مدرن امروزه به شدت بر آن متکی است. فرایند Data Mining را نباید با روش‌های متداول آنالیز داده و اطلاعات و سیستم های تصمیم‌گیری معمولی یکی دانست. به کمک روش‌های Data Mining می‌توان به پرسش هایی (عمدتاً تجاری) پاسخ گفت که بطور سنتی عملاً امکان وجود ندارد.
 
 
بخشی از منابع و مراجع پروژه فایل (word) بررسی کامل مبحث داده کاوی یا Data Mining
 
[1] داده کاوی (Data Mining), تالیف مهمد کانتاردزیک, ترجمه امیر علیخانزاده, 1385, ویرایش اول
[2] Introduction to Data Mining and Knowledge Discovery, Two Crows Corporation, 1999
[3] Data Mining: Concepts and Techniques, M.Kamber and J.Han, 2001
[4] مقاله Algorithms for Association Rule Mining – A General Survey and comparison نوشته Jochen Hipp و Gholamreza Nakhaeizadeh , در کنفرانس ACM SIGKDD July 2000
[5] مقاله Comparative Study of Association Rules Mining Algorithms نوشته Stefan Holban (http://www.bmf.hu/conferences/saci04/Gyorodi.pdf)
[6] 
http://ece.ut.ac.ir/DBRG/seminars/Keykhah/Data Mining/Data mining.doc      
http://ece.ut.ac.ir/DBRG/seminars/Ghadimi-Abbasi-Pashaei/Document/datamining_Introduction.doc

لینک کمکی