تمارین درسی

تمرینات فصل سوم کتاب Data Mining Concepts and Techniques

تمرینات فصل سوم کتاب Data Mining Concepts and Techniques

وضعیت : موجود

برند :تمارین درسی

تعداد بازدید: 61
0 0

این بخش شامل تمرین های 3.3 و 3.7 و 3.8 و 3.11 فصل سوم از کتاب  Data Mining: Concepts and Techniques  است

سوالات این تمرینها به شرح زیر است

3.3 Exercise 2.2 gave the following data (in increasing order) for the attribute age: 13, 15, 16, 16, 19, 20, 20, 21, 22, 22, 25, 25, 25, 25, 30, 33, 33, 35, 35, 35, 35, 36, 40, 45, 46, 52, 70.

(a) Use smoothing by bin means to smooth these data, using a bin depth of 3. Illustrate your steps. Comment on the effect of this technique for the given data.
(b) How might you determine outliers in the data?

 

3.7 Using the data for age given in Exercise 3.3, answer the following:
(a) Use min-max normalization to transform the value 35 for age onto the range [0.0,1.0].

(b) Use z-score normalization to transform the value 35 for age, where the standard deviation of age is 12.94 years.
(c) Use normalization by decimal scaling to transform the value 35 for age.
(d) Comment on which method you would prefer to use for the given data, giving reasons as to why

3.8 Using the data for age and body fat given in Exercise 2.4, answer the following:

Calculate the correlation coefficient (Pearson’s product moment coefficient). Are these two attributes positively or negatively correlated? Compute their covariance.

3.11 Using the data for age given in Exercise 3.3

b) Sketch examples of each of the following sampling techniques: SRSWOR, SRSWR, cluster sampling, and stratified sampling. Use samples of size 5 and the strata “youth,” “middle-aged,” and “senior.

 

خروجی

bin1 =

    13    16    20
    15    19    21
    16    20    22



bin3 =

    35    36    46



normalized =

   34.7719


R =

    1.0000    0.8176
    0.8176    1.0000


ans =

    33    35    35    20    20


ans =

    22    25    20    35    52

Cluster 1
    45    46

Cluster 2
    30    33    33    35    35    35    35    36    40

Cluster 3
    13    15    16    16    19    20    20    21    22    22    25    25    25    25

Cluster 4
    52

Cluster 5
    70


cluter_R_idx =

     5     1

Choosen Clusters >>>>>>>>>>>>>>>>>>>
    45    46

    30    33    33    35    35    35    35    36    40

for label young   Choose >>>>>>>>>>
    [19]

for label middle   Choose >>>>>>>>>>
    [36]

for label senior   Choose >>>>>>>>>>
    [70]

 

توجه : فایل دانلودی حاوی کد متلب و گزارش کامل مربوط به کدها است.

 

در صورت هر گونه سوال نسبت به کالای مورد نظر، با ایمیل msd.abasian@gmail.com  یا شماره 09132324263 و یا آیدی تلگرام masoudabasian مکاتبه نمایید.

همچنین در صورت دانلود فایل و مشاهده هر گونه مشکل در کدها و گزارش، میتوانید در قسمت تماس با ما مشکل را اعلام فرمایید تا در اسرع وقت پشتیبانی لازم را انجام دهیم.

با تشکر از حسن اعتماد شما

مسعود عباسیان

تمرینات فصل سوم کتاب Data Mining Concepts and Techniques

9,000 تومان افزودن به سبد خرید

محل نوشتن دیدگاه شما


تعداد نظرات : 0