بهکارگیری دادهکاوی در پایگاههای داده عظیم
تعداد صفحات : 72 با فرمت ورد و قابل ویرایش
در نسل اول یا نسل سنتی، فقط انجام پرسوجوهای ساده امکانپذیر بود، مثلاً تعداد فروش یک کالای خاص چقدر است؟ میزان خرید یک مشتری خاص در ماه جاری چه مبلغی است؟ در نسل دوم یا همان پردازش لحظهای برخط (OLAP) امکان پرسوجوی همزمان چندبعدی فراهم گردید. در این روش بهعنوانمثال به سؤالاتی مانند: «میزان فروش محصولات به تفکیک فروشنده، خریدار و مسیر خاص چقدر است؟» بهصورت لحظهای و با استفاده از مکعب تصمیم و گزارش ماتریسی پاسخ داده میشود؛ اما در نسل سوم یا همان دادهکاوی فقط مسئله پرسوجو و دریافت گزارشها از دادهها نیست، بلکه از حجم انبوه دادهها، الگویی کشف میشود که هیچوقت امکان کشف این الگوها در پردازش لحظهای برخط (OLAP) یا روش سنتی وجود نداشت. انواع اطلاعات و الگوهایی که از طریق دادهکاوی به دست میآیند و کاربرد دارند عبارتاند از: وابستگی، تسلسل و توالی، طبقهبندی، خوشهبندی و پیشبینی. برای استخراج این الگوها اغلب از روشهای نوینی مانند شبکه عصبی و درختهای تصمیم استفاده میشود. در عمل برای امکان انجام دادهکاوی و استفاده از تکنیکهای فوقالذکر، ابتدا باید نسبت به ایجاد یک انبار داده مناسب اقدام کرد. یک انبار داده در حقیقت پایگاه دادهای است که دادههای جاری و همچنین سوابق قبلی تراکنشها را در خود ذخیره کرده و با منابع خارج سازمان نیز ارتباط برقرار میکند.
دادهکاوی، فرآیند مرتبسازی و طبقهبندی دادههای حجیم و آشکارسازی اطلاعات مرتبط باهم میباشد. امروزه دادهکاوی بهعنوان یکی از ابزارهای بسیار مهم مدیران جهت شناخت وضعیت دقیقتر سازمان و همچنین کمک در اتخاذ تصمیمات مناسب کاربرد دارد. با استفاده از این تکنیک، دادههای موجود در سازمان با بهکارگیری ابزارهای نرمافزاری، موردبررسی و تحلیل دقیق قرار میگیرد تا الگوهای پنهان و پیچیدهای که در آنها وجود دارد کشف و استخراج گردد. دادهکاوی را میتوان نسل سوم تکنولوژیهایی نامید که با داده سروکار دارند.
چکیده
فصل اول: مقدمهای بر دادهکاوی
1-1- دلیل پیدایش دادهکاوی
1-2- روند کشف دانش
1-3- جایگاه دادهکاوی در میان علوم مختلف
1-4- چهکارهایی را نمیتوان با دادهکاوی انجام داد
1-5- دادهکاوی در مقابل انبار داده
1-6- دادهکاوی در مقابل پردازش لحظهای برخط (OLAP)
1-7- کاربرد هوش مصنوعی و آمار در دادهکاوی
فصل دوم: توصیف دادهها در دادهکاوی
2-1- خلاصهسازی و به تصویر درآوردن دادهها
2-2- خوشهبندی
2-3- تحلیل لینک
فصل سوم: مدلهای پیشبینی دادهها
3-1- کلاسبندی
3-2- رگرسیون
3-3- دنباله زمان
فصل چهارم: مدلها و الگوریتمهای دادهکاوی
4-1- شبکههای عصبی
4-2- درختهای تصمیم
4-3- مارس
4-4- استنتاج قوانین
4-5- K- نزدیکترین همسایه و استدلال مبتنی بر حافظه
4-6- رگرسیون منطقی
4-7- تحلیل تفکیکی
4-8- مدل افزودنی کلی
4-9- افزایشی
فصل پنجم: سلسلهمراتب انتخابها
فصل ششم: مراحل فرآیند کشف دانش از پایگاه دادهها
6-1- انبارش دادهها
6-2- انتخاب دادهها
6-3- تبدیل دادهها
6-4- کاوش دادهها
6-5- تفسیر نتیجه
فصل هفتم: عملیات دادهکاوی
7-1- مدلسازی پیشگوییکننده
7-2- تقطیع پایگاه دادهها
7-3- تحلیل پیوند
7-4- تشخیص انحراف
فصل هشتم: قابلیتهای دادهکاوی
8-1- دادهکاوی و انبار دادهها
8-2- دادهکاوی، آمار و هوش مصنوعی
8-3- کاربردهای دادهکاوی
8-4- دادهکاوی موفق
8-5- تحلیل ارتباطات
فصل نهم: طبقهبندی
9-1- تئوری بیز
9-2- رگرسیون
9-3- گروهبندی دادهها
9-4- بخشبندی
9-5- سلسله مراتبی
9-6- گروهبندی بر اساس تراکم
9-7- کاوش قوانین پیوندی
9-8- آپریوری
9-9- دی. اچ.پی
9-10- خلاصهسازی و کلینگری دادهها در سطوح مختلف
9-11- رهیافت هرم دادهها
9-12- رهیافت استنتاج بر اساس صفت خاصه
9-13- الگوریتمهای ژنتیک
فصل دهم: ساختن یک پایگاه داده دادهکاوی
10-1- جستجوی داده
10-2- آمادهسازی داده برای مدلسازی
10-3- ساختن مدل دادهکاوی
10-4- تائید اعتبار ساده
10-5- ارزیابی و تفسیر
فصل یازدهم: ماتریسهای پیچیدگی
11-1- ایجاد معماری مدل و نتایج
نتیجهگیری
منابع و مراجع
فهرست شکلها
شکل (1-1): دادهکاوی بهعنوان یک مرحله از فرآیند کشف دانش
شکل (1-2): سیر تکاملی صنعت پایگاه داده
شکل (1-3): معماری یک نمونه سیستم داده کاو
شکل (1-4): دادهها از انبار دادهها استخراج میگردند
شکل (1-5): دادهها از چند پایگاه داده استخراجشدهاند
شکل (4-1): شبکه عصبی با یک لایه نهان
شکل (4-2): Wx,y وزن یال بین x و y است
شکل (4-3): درخت تصمیمگیری
شکل (4-4): محدوده همسایگی (بیشتر همسایهها در دسته x قرارگرفتهاند)
شکل (8-1): دادهها از انبار دادهها استخراج میگردند
شکل (8-2): ساختار ارتباطاتی به روش گرافیکی