Assignment 1 - Introduction to Machine Learning

For this assignment, you will be using the Breast Cancer Wisconsin (Diagnostic) Database to create a classifier that can help diagnose patients. First, read through the description of the dataset (below).

In [1]:
import numpy as np
import pandas as pd
from sklearn.datasets import load_breast_cancer

cancer = load_breast_cancer()

#print(cancer.DESCR) # Print the data set description

The object returned by load_breast_cancer() is a scikit-learn Bunch object, which is similar to a dictionary.

In [3]:
cancer.keys()
Out[3]:
dict_keys(['data', 'target', 'target_names', 'DESCR', 'feature_names'])
In [8]:
type(cancer)
Out[8]:
sklearn.utils.Bunch

Question 0

How many features does the breast cancer dataset have?

This function should return an integer.

In [3]:
# You should write your whole answer within the function provided. The autograder will call
# this function and compare the return value against the correct solution value
def answer_zero():
    # This function returns the number of features of the breast cancer dataset, which is an integer. 
    # The assignment question description will tell you the general format the autograder is expecting
    return len(cancer['feature_names'])

# You can examine what your function returns by calling it in the cell. If you have questions
# about the assignment formats, check out the discussion forums for any FAQs
answer_zero() 
Out[3]:
30

Question 1

Scikit-learn works with lists, numpy arrays, scipy-sparse matrices, and pandas DataFrames, so converting the dataset to a DataFrame is not necessary for training this model. Using a DataFrame does however help make many things easier such as munging data, so let's practice creating a classifier with a pandas DataFrame.

Convert the sklearn.dataset cancer to a DataFrame.

This function should return a (569, 31) DataFrame with

columns =

['mean radius', 'mean texture', 'mean perimeter', 'mean area',
'mean smoothness', 'mean compactness', 'mean concavity',
'mean concave points', 'mean symmetry', 'mean fractal dimension',
'radius error', 'texture error', 'perimeter error', 'area error',
'smoothness error', 'compactness error', 'concavity error',
'concave points error', 'symmetry error', 'fractal dimension error',
'worst radius', 'worst texture', 'worst perimeter', 'worst area',
'worst smoothness', 'worst compactness', 'worst concavity',
'worst concave points', 'worst symmetry', 'worst fractal dimension',
'target']

and index =

RangeIndex(start=0, stop=569, step=1)
In [36]:
def answer_one():
    
    # Your code here
    df = pd.DataFrame(cancer['data'], columns=cancer['feature_names'])
    df['target'] = cancer['target']
    return df


answer_one()
Out[36]:
mean radius mean texture mean perimeter mean area mean smoothness mean compactness mean concavity mean concave points mean symmetry mean fractal dimension ... worst texture worst perimeter worst area worst smoothness worst compactness worst concavity worst concave points worst symmetry worst fractal dimension target
0 17.990 10.38 122.80 1001.0 0.11840 0.27760 0.300100 0.147100 0.2419 0.07871 ... 17.33 184.60 2019.0 0.16220 0.66560 0.71190 0.26540 0.4601 0.11890 0
1 20.570 17.77 132.90 1326.0 0.08474 0.07864 0.086900 0.070170 0.1812 0.05667 ... 23.41 158.80 1956.0 0.12380 0.18660 0.24160 0.18600 0.2750 0.08902 0
2 19.690 21.25 130.00 1203.0 0.10960 0.15990 0.197400 0.127900 0.2069 0.05999 ... 25.53 152.50 1709.0 0.14440 0.42450 0.45040 0.24300 0.3613 0.08758 0
3 11.420 20.38 77.58 386.1 0.14250 0.28390 0.241400 0.105200 0.2597 0.09744 ... 26.50 98.87 567.7 0.20980 0.86630 0.68690 0.25750 0.6638 0.17300 0
4 20.290 14.34 135.10 1297.0 0.10030 0.13280 0.198000 0.104300 0.1809 0.05883 ... 16.67 152.20 1575.0 0.13740 0.20500 0.40000 0.16250 0.2364 0.07678 0
5 12.450 15.70 82.57 477.1 0.12780 0.17000 0.157800 0.080890 0.2087 0.07613 ... 23.75 103.40 741.6 0.17910 0.52490 0.53550 0.17410 0.3985 0.12440 0
6 18.250 19.98 119.60 1040.0 0.09463 0.10900 0.112700 0.074000 0.1794 0.05742 ... 27.66 153.20 1606.0 0.14420 0.25760 0.37840 0.19320 0.3063 0.08368 0
7 13.710 20.83 90.20 577.9 0.11890 0.16450 0.093660 0.059850 0.2196 0.07451 ... 28.14 110.60 897.0 0.16540 0.36820 0.26780 0.15560 0.3196 0.11510 0
8 13.000 21.82 87.50 519.8 0.12730 0.19320 0.185900 0.093530 0.2350 0.07389 ... 30.73 106.20 739.3 0.17030 0.54010 0.53900 0.20600 0.4378 0.10720 0
9 12.460 24.04 83.97 475.9 0.11860 0.23960 0.227300 0.085430 0.2030 0.08243 ... 40.68 97.65 711.4 0.18530 1.05800 1.10500 0.22100 0.4366 0.20750 0
10 16.020 23.24 102.70 797.8 0.08206 0.06669 0.032990 0.033230 0.1528 0.05697 ... 33.88 123.80 1150.0 0.11810 0.15510 0.14590 0.09975 0.2948 0.08452 0
11 15.780 17.89 103.60 781.0 0.09710 0.12920 0.099540 0.066060 0.1842 0.06082 ... 27.28 136.50 1299.0 0.13960 0.56090 0.39650 0.18100 0.3792 0.10480 0
12 19.170 24.80 132.40 1123.0 0.09740 0.24580 0.206500 0.111800 0.2397 0.07800 ... 29.94 151.70 1332.0 0.10370 0.39030 0.36390 0.17670 0.3176 0.10230 0
13 15.850 23.95 103.70 782.7 0.08401 0.10020 0.099380 0.053640 0.1847 0.05338 ... 27.66 112.00 876.5 0.11310 0.19240 0.23220 0.11190 0.2809 0.06287 0
14 13.730 22.61 93.60 578.3 0.11310 0.22930 0.212800 0.080250 0.2069 0.07682 ... 32.01 108.80 697.7 0.16510 0.77250 0.69430 0.22080 0.3596 0.14310 0
15 14.540 27.54 96.73 658.8 0.11390 0.15950 0.163900 0.073640 0.2303 0.07077 ... 37.13 124.10 943.2 0.16780 0.65770 0.70260 0.17120 0.4218 0.13410 0
16 14.680 20.13 94.74 684.5 0.09867 0.07200 0.073950 0.052590 0.1586 0.05922 ... 30.88 123.40 1138.0 0.14640 0.18710 0.29140 0.16090 0.3029 0.08216 0
17 16.130 20.68 108.10 798.8 0.11700 0.20220 0.172200 0.102800 0.2164 0.07356 ... 31.48 136.80 1315.0 0.17890 0.42330 0.47840 0.20730 0.3706 0.11420 0
18 19.810 22.15 130.00 1260.0 0.09831 0.10270 0.147900 0.094980 0.1582 0.05395 ... 30.88 186.80 2398.0 0.15120 0.31500 0.53720 0.23880 0.2768 0.07615 0
19 13.540 14.36 87.46 566.3 0.09779 0.08129 0.066640 0.047810 0.1885 0.05766 ... 19.26 99.70 711.2 0.14400 0.17730 0.23900 0.12880 0.2977 0.07259 1
20 13.080 15.71 85.63 520.0 0.10750 0.12700 0.045680 0.031100 0.1967 0.06811 ... 20.49 96.09 630.5 0.13120 0.27760 0.18900 0.07283 0.3184 0.08183 1
21 9.504 12.44 60.34 273.9 0.10240 0.06492 0.029560 0.020760 0.1815 0.06905 ... 15.66 65.13 314.9 0.13240 0.11480 0.08867 0.06227 0.2450 0.07773 1
22 15.340 14.26 102.50 704.4 0.10730 0.21350 0.207700 0.097560 0.2521 0.07032 ... 19.08 125.10 980.9 0.13900 0.59540 0.63050 0.23930 0.4667 0.09946 0
23 21.160 23.04 137.20 1404.0 0.09428 0.10220 0.109700 0.086320 0.1769 0.05278 ... 35.59 188.00 2615.0 0.14010 0.26000 0.31550 0.20090 0.2822 0.07526 0
24 16.650 21.38 110.00 904.6 0.11210 0.14570 0.152500 0.091700 0.1995 0.06330 ... 31.56 177.00 2215.0 0.18050 0.35780 0.46950 0.20950 0.3613 0.09564 0
25 17.140 16.40 116.00 912.7 0.11860 0.22760 0.222900 0.140100 0.3040 0.07413 ... 21.40 152.40 1461.0 0.15450 0.39490 0.38530 0.25500 0.4066 0.10590 0
26 14.580 21.53 97.41 644.8 0.10540 0.18680 0.142500 0.087830 0.2252 0.06924 ... 33.21 122.40 896.9 0.15250 0.66430 0.55390 0.27010 0.4264 0.12750 0
27 18.610 20.25 122.10 1094.0 0.09440 0.10660 0.149000 0.077310 0.1697 0.05699 ... 27.26 139.90 1403.0 0.13380 0.21170 0.34460 0.14900 0.2341 0.07421 0
28 15.300 25.27 102.40 732.4 0.10820 0.16970 0.168300 0.087510 0.1926 0.06540 ... 36.71 149.30 1269.0 0.16410 0.61100 0.63350 0.20240 0.4027 0.09876 0
29 17.570 15.05 115.00 955.1 0.09847 0.11570 0.098750 0.079530 0.1739 0.06149 ... 19.52 134.90 1227.0 0.12550 0.28120 0.24890 0.14560 0.2756 0.07919 0
... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ...
539 7.691 25.44 48.34 170.4 0.08668 0.11990 0.092520 0.013640 0.2037 0.07751 ... 31.89 54.49 223.6 0.15960 0.30640 0.33930 0.05000 0.2790 0.10660 1
540 11.540 14.44 74.65 402.9 0.09984 0.11200 0.067370 0.025940 0.1818 0.06782 ... 19.68 78.78 457.8 0.13450 0.21180 0.17970 0.06918 0.2329 0.08134 1
541 14.470 24.99 95.81 656.4 0.08837 0.12300 0.100900 0.038900 0.1872 0.06341 ... 31.73 113.50 808.9 0.13400 0.42020 0.40400 0.12050 0.3187 0.10230 1
542 14.740 25.42 94.70 668.6 0.08275 0.07214 0.041050 0.030270 0.1840 0.05680 ... 32.29 107.40 826.4 0.10600 0.13760 0.16110 0.10950 0.2722 0.06956 1
543 13.210 28.06 84.88 538.4 0.08671 0.06877 0.029870 0.032750 0.1628 0.05781 ... 37.17 92.48 629.6 0.10720 0.13810 0.10620 0.07958 0.2473 0.06443 1
544 13.870 20.70 89.77 584.8 0.09578 0.10180 0.036880 0.023690 0.1620 0.06688 ... 24.75 99.17 688.6 0.12640 0.20370 0.13770 0.06845 0.2249 0.08492 1
545 13.620 23.23 87.19 573.2 0.09246 0.06747 0.029740 0.024430 0.1664 0.05801 ... 29.09 97.58 729.8 0.12160 0.15170 0.10490 0.07174 0.2642 0.06953 1
546 10.320 16.35 65.31 324.9 0.09434 0.04994 0.010120 0.005495 0.1885 0.06201 ... 21.77 71.12 384.9 0.12850 0.08842 0.04384 0.02381 0.2681 0.07399 1
547 10.260 16.58 65.85 320.8 0.08877 0.08066 0.043580 0.024380 0.1669 0.06714 ... 22.04 71.08 357.4 0.14610 0.22460 0.17830 0.08333 0.2691 0.09479 1
548 9.683 19.34 61.05 285.7 0.08491 0.05030 0.023370 0.009615 0.1580 0.06235 ... 25.59 69.10 364.2 0.11990 0.09546 0.09350 0.03846 0.2552 0.07920 1
549 10.820 24.21 68.89 361.6 0.08192 0.06602 0.015480 0.008160 0.1976 0.06328 ... 31.45 83.90 505.6 0.12040 0.16330 0.06194 0.03264 0.3059 0.07626 1
550 10.860 21.48 68.51 360.5 0.07431 0.04227 0.000000 0.000000 0.1661 0.05948 ... 24.77 74.08 412.3 0.10010 0.07348 0.00000 0.00000 0.2458 0.06592 1
551 11.130 22.44 71.49 378.4 0.09566 0.08194 0.048240 0.022570 0.2030 0.06552 ... 28.26 77.80 436.6 0.10870 0.17820 0.15640 0.06413 0.3169 0.08032 1
552 12.770 29.43 81.35 507.9 0.08276 0.04234 0.019970 0.014990 0.1539 0.05637 ... 36.00 88.10 594.7 0.12340 0.10640 0.08653 0.06498 0.2407 0.06484 1
553 9.333 21.94 59.01 264.0 0.09240 0.05605 0.039960 0.012820 0.1692 0.06576 ... 25.05 62.86 295.8 0.11030 0.08298 0.07993 0.02564 0.2435 0.07393 1
554 12.880 28.92 82.50 514.3 0.08123 0.05824 0.061950 0.023430 0.1566 0.05708 ... 35.74 88.84 595.7 0.12270 0.16200 0.24390 0.06493 0.2372 0.07242 1
555 10.290 27.61 65.67 321.4 0.09030 0.07658 0.059990 0.027380 0.1593 0.06127 ... 34.91 69.57 357.6 0.13840 0.17100 0.20000 0.09127 0.2226 0.08283 1
556 10.160 19.59 64.73 311.7 0.10030 0.07504 0.005025 0.011160 0.1791 0.06331 ... 22.88 67.88 347.3 0.12650 0.12000 0.01005 0.02232 0.2262 0.06742 1
557 9.423 27.88 59.26 271.3 0.08123 0.04971 0.000000 0.000000 0.1742 0.06059 ... 34.24 66.50 330.6 0.10730 0.07158 0.00000 0.00000 0.2475 0.06969 1
558 14.590 22.68 96.39 657.1 0.08473 0.13300 0.102900 0.037360 0.1454 0.06147 ... 27.27 105.90 733.5 0.10260 0.31710 0.36620 0.11050 0.2258 0.08004 1
559 11.510 23.93 74.52 403.5 0.09261 0.10210 0.111200 0.041050 0.1388 0.06570 ... 37.16 82.28 474.2 0.12980 0.25170 0.36300 0.09653 0.2112 0.08732 1
560 14.050 27.15 91.38 600.4 0.09929 0.11260 0.044620 0.043040 0.1537 0.06171 ... 33.17 100.20 706.7 0.12410 0.22640 0.13260 0.10480 0.2250 0.08321 1
561 11.200 29.37 70.67 386.0 0.07449 0.03558 0.000000 0.000000 0.1060 0.05502 ... 38.30 75.19 439.6 0.09267 0.05494 0.00000 0.00000 0.1566 0.05905 1
562 15.220 30.62 103.40 716.9 0.10480 0.20870 0.255000 0.094290 0.2128 0.07152 ... 42.79 128.70 915.0 0.14170 0.79170 1.17000 0.23560 0.4089 0.14090 0
563 20.920 25.09 143.00 1347.0 0.10990 0.22360 0.317400 0.147400 0.2149 0.06879 ... 29.41 179.10 1819.0 0.14070 0.41860 0.65990 0.25420 0.2929 0.09873 0
564 21.560 22.39 142.00 1479.0 0.11100 0.11590 0.243900 0.138900 0.1726 0.05623 ... 26.40 166.10 2027.0 0.14100 0.21130 0.41070 0.22160 0.2060 0.07115 0
565 20.130 28.25 131.20 1261.0 0.09780 0.10340 0.144000 0.097910 0.1752 0.05533 ... 38.25 155.00 1731.0 0.11660 0.19220 0.32150 0.16280 0.2572 0.06637 0
566 16.600 28.08 108.30 858.1 0.08455 0.10230 0.092510 0.053020 0.1590 0.05648 ... 34.12 126.70 1124.0 0.11390 0.30940 0.34030 0.14180 0.2218 0.07820 0
567 20.600 29.33 140.10 1265.0 0.11780 0.27700 0.351400 0.152000 0.2397 0.07016 ... 39.42 184.60 1821.0 0.16500 0.86810 0.93870 0.26500 0.4087 0.12400 0
568 7.760 24.54 47.92 181.0 0.05263 0.04362 0.000000 0.000000 0.1587 0.05884 ... 30.37 59.16 268.6 0.08996 0.06444 0.00000 0.00000 0.2871 0.07039 1

569 rows × 31 columns

Question 2

What is the class distribution? (i.e. how many instances of malignant (encoded 0) and how many benign (encoded 1)?)

This function should return a Series named target of length 2 with integer values and index = ['malignant', 'benign']

In [52]:
def answer_two():
    cancerdf = answer_one()
    
    # Your code here
    maliganant = sum(cancerdf['target'] == 0)
    benign = sum(cancerdf['target'] == 1)
    target = pd.Series([maliganant, benign], index=['maliganant', 'benign'])
    return target


answer_two()
Out[52]:
maliganant    212
benign        357
dtype: int64

Question 3

Split the DataFrame into X (the data) and y (the labels).

This function should return a tuple of length 2: (X, y), where

  • X, a pandas DataFrame, has shape (569, 30)
  • y, a pandas Series, has shape (569,).
In [70]:
def answer_three():
    cancerdf = answer_one()
    
    # Your code here
    X =cancerdf.iloc[:,:30]
    y =cancerdf['target']
    return X, y
answer_three()
Out[70]:
(     mean radius  mean texture  mean perimeter  mean area  mean smoothness  \
 0         17.990         10.38          122.80     1001.0          0.11840   
 1         20.570         17.77          132.90     1326.0          0.08474   
 2         19.690         21.25          130.00     1203.0          0.10960   
 3         11.420         20.38           77.58      386.1          0.14250   
 4         20.290         14.34          135.10     1297.0          0.10030   
 5         12.450         15.70           82.57      477.1          0.12780   
 6         18.250         19.98          119.60     1040.0          0.09463   
 7         13.710         20.83           90.20      577.9          0.11890   
 8         13.000         21.82           87.50      519.8          0.12730   
 9         12.460         24.04           83.97      475.9          0.11860   
 10        16.020         23.24          102.70      797.8          0.08206   
 11        15.780         17.89          103.60      781.0          0.09710   
 12        19.170         24.80          132.40     1123.0          0.09740   
 13        15.850         23.95          103.70      782.7          0.08401   
 14        13.730         22.61           93.60      578.3          0.11310   
 15        14.540         27.54           96.73      658.8          0.11390   
 16        14.680         20.13           94.74      684.5          0.09867   
 17        16.130         20.68          108.10      798.8          0.11700   
 18        19.810         22.15          130.00     1260.0          0.09831   
 19        13.540         14.36           87.46      566.3          0.09779   
 20        13.080         15.71           85.63      520.0          0.10750   
 21         9.504         12.44           60.34      273.9          0.10240   
 22        15.340         14.26          102.50      704.4          0.10730   
 23        21.160         23.04          137.20     1404.0          0.09428   
 24        16.650         21.38          110.00      904.6          0.11210   
 25        17.140         16.40          116.00      912.7          0.11860   
 26        14.580         21.53           97.41      644.8          0.10540   
 27        18.610         20.25          122.10     1094.0          0.09440   
 28        15.300         25.27          102.40      732.4          0.10820   
 29        17.570         15.05          115.00      955.1          0.09847   
 ..           ...           ...             ...        ...              ...   
 539        7.691         25.44           48.34      170.4          0.08668   
 540       11.540         14.44           74.65      402.9          0.09984   
 541       14.470         24.99           95.81      656.4          0.08837   
 542       14.740         25.42           94.70      668.6          0.08275   
 543       13.210         28.06           84.88      538.4          0.08671   
 544       13.870         20.70           89.77      584.8          0.09578   
 545       13.620         23.23           87.19      573.2          0.09246   
 546       10.320         16.35           65.31      324.9          0.09434   
 547       10.260         16.58           65.85      320.8          0.08877   
 548        9.683         19.34           61.05      285.7          0.08491   
 549       10.820         24.21           68.89      361.6          0.08192   
 550       10.860         21.48           68.51      360.5          0.07431   
 551       11.130         22.44           71.49      378.4          0.09566   
 552       12.770         29.43           81.35      507.9          0.08276   
 553        9.333         21.94           59.01      264.0          0.09240   
 554       12.880         28.92           82.50      514.3          0.08123   
 555       10.290         27.61           65.67      321.4          0.09030   
 556       10.160         19.59           64.73      311.7          0.10030   
 557        9.423         27.88           59.26      271.3          0.08123   
 558       14.590         22.68           96.39      657.1          0.08473   
 559       11.510         23.93           74.52      403.5          0.09261   
 560       14.050         27.15           91.38      600.4          0.09929   
 561       11.200         29.37           70.67      386.0          0.07449   
 562       15.220         30.62          103.40      716.9          0.10480   
 563       20.920         25.09          143.00     1347.0          0.10990   
 564       21.560         22.39          142.00     1479.0          0.11100   
 565       20.130         28.25          131.20     1261.0          0.09780   
 566       16.600         28.08          108.30      858.1          0.08455   
 567       20.600         29.33          140.10     1265.0          0.11780   
 568        7.760         24.54           47.92      181.0          0.05263   
 
      mean compactness  mean concavity  mean concave points  mean symmetry  \
 0             0.27760        0.300100             0.147100         0.2419   
 1             0.07864        0.086900             0.070170         0.1812   
 2             0.15990        0.197400             0.127900         0.2069   
 3             0.28390        0.241400             0.105200         0.2597   
 4             0.13280        0.198000             0.104300         0.1809   
 5             0.17000        0.157800             0.080890         0.2087   
 6             0.10900        0.112700             0.074000         0.1794   
 7             0.16450        0.093660             0.059850         0.2196   
 8             0.19320        0.185900             0.093530         0.2350   
 9             0.23960        0.227300             0.085430         0.2030   
 10            0.06669        0.032990             0.033230         0.1528   
 11            0.12920        0.099540             0.066060         0.1842   
 12            0.24580        0.206500             0.111800         0.2397   
 13            0.10020        0.099380             0.053640         0.1847   
 14            0.22930        0.212800             0.080250         0.2069   
 15            0.15950        0.163900             0.073640         0.2303   
 16            0.07200        0.073950             0.052590         0.1586   
 17            0.20220        0.172200             0.102800         0.2164   
 18            0.10270        0.147900             0.094980         0.1582   
 19            0.08129        0.066640             0.047810         0.1885   
 20            0.12700        0.045680             0.031100         0.1967   
 21            0.06492        0.029560             0.020760         0.1815   
 22            0.21350        0.207700             0.097560         0.2521   
 23            0.10220        0.109700             0.086320         0.1769   
 24            0.14570        0.152500             0.091700         0.1995   
 25            0.22760        0.222900             0.140100         0.3040   
 26            0.18680        0.142500             0.087830         0.2252   
 27            0.10660        0.149000             0.077310         0.1697   
 28            0.16970        0.168300             0.087510         0.1926   
 29            0.11570        0.098750             0.079530         0.1739   
 ..                ...             ...                  ...            ...   
 539           0.11990        0.092520             0.013640         0.2037   
 540           0.11200        0.067370             0.025940         0.1818   
 541           0.12300        0.100900             0.038900         0.1872   
 542           0.07214        0.041050             0.030270         0.1840   
 543           0.06877        0.029870             0.032750         0.1628   
 544           0.10180        0.036880             0.023690         0.1620   
 545           0.06747        0.029740             0.024430         0.1664   
 546           0.04994        0.010120             0.005495         0.1885   
 547           0.08066        0.043580             0.024380         0.1669   
 548           0.05030        0.023370             0.009615         0.1580   
 549           0.06602        0.015480             0.008160         0.1976   
 550           0.04227        0.000000             0.000000         0.1661   
 551           0.08194        0.048240             0.022570         0.2030   
 552           0.04234        0.019970             0.014990         0.1539   
 553           0.05605        0.039960             0.012820         0.1692   
 554           0.05824        0.061950             0.023430         0.1566   
 555           0.07658        0.059990             0.027380         0.1593   
 556           0.07504        0.005025             0.011160         0.1791   
 557           0.04971        0.000000             0.000000         0.1742   
 558           0.13300        0.102900             0.037360         0.1454   
 559           0.10210        0.111200             0.041050         0.1388   
 560           0.11260        0.044620             0.043040         0.1537   
 561           0.03558        0.000000             0.000000         0.1060   
 562           0.20870        0.255000             0.094290         0.2128   
 563           0.22360        0.317400             0.147400         0.2149   
 564           0.11590        0.243900             0.138900         0.1726   
 565           0.10340        0.144000             0.097910         0.1752   
 566           0.10230        0.092510             0.053020         0.1590   
 567           0.27700        0.351400             0.152000         0.2397   
 568           0.04362        0.000000             0.000000         0.1587   
 
      mean fractal dimension           ...             worst radius  \
 0                   0.07871           ...                   25.380   
 1                   0.05667           ...                   24.990   
 2                   0.05999           ...                   23.570   
 3                   0.09744           ...                   14.910   
 4                   0.05883           ...                   22.540   
 5                   0.07613           ...                   15.470   
 6                   0.05742           ...                   22.880   
 7                   0.07451           ...                   17.060   
 8                   0.07389           ...                   15.490   
 9                   0.08243           ...                   15.090   
 10                  0.05697           ...                   19.190   
 11                  0.06082           ...                   20.420   
 12                  0.07800           ...                   20.960   
 13                  0.05338           ...                   16.840   
 14                  0.07682           ...                   15.030   
 15                  0.07077           ...                   17.460   
 16                  0.05922           ...                   19.070   
 17                  0.07356           ...                   20.960   
 18                  0.05395           ...                   27.320   
 19                  0.05766           ...                   15.110   
 20                  0.06811           ...                   14.500   
 21                  0.06905           ...                   10.230   
 22                  0.07032           ...                   18.070   
 23                  0.05278           ...                   29.170   
 24                  0.06330           ...                   26.460   
 25                  0.07413           ...                   22.250   
 26                  0.06924           ...                   17.620   
 27                  0.05699           ...                   21.310   
 28                  0.06540           ...                   20.270   
 29                  0.06149           ...                   20.010   
 ..                      ...           ...                      ...   
 539                 0.07751           ...                    8.678   
 540                 0.06782           ...                   12.260   
 541                 0.06341           ...                   16.220   
 542                 0.05680           ...                   16.510   
 543                 0.05781           ...                   14.370   
 544                 0.06688           ...                   15.050   
 545                 0.05801           ...                   15.350   
 546                 0.06201           ...                   11.250   
 547                 0.06714           ...                   10.830   
 548                 0.06235           ...                   10.930   
 549                 0.06328           ...                   13.030   
 550                 0.05948           ...                   11.660   
 551                 0.06552           ...                   12.020   
 552                 0.05637           ...                   13.870   
 553                 0.06576           ...                    9.845   
 554                 0.05708           ...                   13.890   
 555                 0.06127           ...                   10.840   
 556                 0.06331           ...                   10.650   
 557                 0.06059           ...                   10.490   
 558                 0.06147           ...                   15.480   
 559                 0.06570           ...                   12.480   
 560                 0.06171           ...                   15.300   
 561                 0.05502           ...                   11.920   
 562                 0.07152           ...                   17.520   
 563                 0.06879           ...                   24.290   
 564                 0.05623           ...                   25.450   
 565                 0.05533           ...                   23.690   
 566                 0.05648           ...                   18.980   
 567                 0.07016           ...                   25.740   
 568                 0.05884           ...                    9.456   
 
      worst texture  worst perimeter  worst area  worst smoothness  \
 0            17.33           184.60      2019.0           0.16220   
 1            23.41           158.80      1956.0           0.12380   
 2            25.53           152.50      1709.0           0.14440   
 3            26.50            98.87       567.7           0.20980   
 4            16.67           152.20      1575.0           0.13740   
 5            23.75           103.40       741.6           0.17910   
 6            27.66           153.20      1606.0           0.14420   
 7            28.14           110.60       897.0           0.16540   
 8            30.73           106.20       739.3           0.17030   
 9            40.68            97.65       711.4           0.18530   
 10           33.88           123.80      1150.0           0.11810   
 11           27.28           136.50      1299.0           0.13960   
 12           29.94           151.70      1332.0           0.10370   
 13           27.66           112.00       876.5           0.11310   
 14           32.01           108.80       697.7           0.16510   
 15           37.13           124.10       943.2           0.16780   
 16           30.88           123.40      1138.0           0.14640   
 17           31.48           136.80      1315.0           0.17890   
 18           30.88           186.80      2398.0           0.15120   
 19           19.26            99.70       711.2           0.14400   
 20           20.49            96.09       630.5           0.13120   
 21           15.66            65.13       314.9           0.13240   
 22           19.08           125.10       980.9           0.13900   
 23           35.59           188.00      2615.0           0.14010   
 24           31.56           177.00      2215.0           0.18050   
 25           21.40           152.40      1461.0           0.15450   
 26           33.21           122.40       896.9           0.15250   
 27           27.26           139.90      1403.0           0.13380   
 28           36.71           149.30      1269.0           0.16410   
 29           19.52           134.90      1227.0           0.12550   
 ..             ...              ...         ...               ...   
 539          31.89            54.49       223.6           0.15960   
 540          19.68            78.78       457.8           0.13450   
 541          31.73           113.50       808.9           0.13400   
 542          32.29           107.40       826.4           0.10600   
 543          37.17            92.48       629.6           0.10720   
 544          24.75            99.17       688.6           0.12640   
 545          29.09            97.58       729.8           0.12160   
 546          21.77            71.12       384.9           0.12850   
 547          22.04            71.08       357.4           0.14610   
 548          25.59            69.10       364.2           0.11990   
 549          31.45            83.90       505.6           0.12040   
 550          24.77            74.08       412.3           0.10010   
 551          28.26            77.80       436.6           0.10870   
 552          36.00            88.10       594.7           0.12340   
 553          25.05            62.86       295.8           0.11030   
 554          35.74            88.84       595.7           0.12270   
 555          34.91            69.57       357.6           0.13840   
 556          22.88            67.88       347.3           0.12650   
 557          34.24            66.50       330.6           0.10730   
 558          27.27           105.90       733.5           0.10260   
 559          37.16            82.28       474.2           0.12980   
 560          33.17           100.20       706.7           0.12410   
 561          38.30            75.19       439.6           0.09267   
 562          42.79           128.70       915.0           0.14170   
 563          29.41           179.10      1819.0           0.14070   
 564          26.40           166.10      2027.0           0.14100   
 565          38.25           155.00      1731.0           0.11660   
 566          34.12           126.70      1124.0           0.11390   
 567          39.42           184.60      1821.0           0.16500   
 568          30.37            59.16       268.6           0.08996   
 
      worst compactness  worst concavity  worst concave points  worst symmetry  \
 0              0.66560          0.71190               0.26540          0.4601   
 1              0.18660          0.24160               0.18600          0.2750   
 2              0.42450          0.45040               0.24300          0.3613   
 3              0.86630          0.68690               0.25750          0.6638   
 4              0.20500          0.40000               0.16250          0.2364   
 5              0.52490          0.53550               0.17410          0.3985   
 6              0.25760          0.37840               0.19320          0.3063   
 7              0.36820          0.26780               0.15560          0.3196   
 8              0.54010          0.53900               0.20600          0.4378   
 9              1.05800          1.10500               0.22100          0.4366   
 10             0.15510          0.14590               0.09975          0.2948   
 11             0.56090          0.39650               0.18100          0.3792   
 12             0.39030          0.36390               0.17670          0.3176   
 13             0.19240          0.23220               0.11190          0.2809   
 14             0.77250          0.69430               0.22080          0.3596   
 15             0.65770          0.70260               0.17120          0.4218   
 16             0.18710          0.29140               0.16090          0.3029   
 17             0.42330          0.47840               0.20730          0.3706   
 18             0.31500          0.53720               0.23880          0.2768   
 19             0.17730          0.23900               0.12880          0.2977   
 20             0.27760          0.18900               0.07283          0.3184   
 21             0.11480          0.08867               0.06227          0.2450   
 22             0.59540          0.63050               0.23930          0.4667   
 23             0.26000          0.31550               0.20090          0.2822   
 24             0.35780          0.46950               0.20950          0.3613   
 25             0.39490          0.38530               0.25500          0.4066   
 26             0.66430          0.55390               0.27010          0.4264   
 27             0.21170          0.34460               0.14900          0.2341   
 28             0.61100          0.63350               0.20240          0.4027   
 29             0.28120          0.24890               0.14560          0.2756   
 ..                 ...              ...                   ...             ...   
 539            0.30640          0.33930               0.05000          0.2790   
 540            0.21180          0.17970               0.06918          0.2329   
 541            0.42020          0.40400               0.12050          0.3187   
 542            0.13760          0.16110               0.10950          0.2722   
 543            0.13810          0.10620               0.07958          0.2473   
 544            0.20370          0.13770               0.06845          0.2249   
 545            0.15170          0.10490               0.07174          0.2642   
 546            0.08842          0.04384               0.02381          0.2681   
 547            0.22460          0.17830               0.08333          0.2691   
 548            0.09546          0.09350               0.03846          0.2552   
 549            0.16330          0.06194               0.03264          0.3059   
 550            0.07348          0.00000               0.00000          0.2458   
 551            0.17820          0.15640               0.06413          0.3169   
 552            0.10640          0.08653               0.06498          0.2407   
 553            0.08298          0.07993               0.02564          0.2435   
 554            0.16200          0.24390               0.06493          0.2372   
 555            0.17100          0.20000               0.09127          0.2226   
 556            0.12000          0.01005               0.02232          0.2262   
 557            0.07158          0.00000               0.00000          0.2475   
 558            0.31710          0.36620               0.11050          0.2258   
 559            0.25170          0.36300               0.09653          0.2112   
 560            0.22640          0.13260               0.10480          0.2250   
 561            0.05494          0.00000               0.00000          0.1566   
 562            0.79170          1.17000               0.23560          0.4089   
 563            0.41860          0.65990               0.25420          0.2929   
 564            0.21130          0.41070               0.22160          0.2060   
 565            0.19220          0.32150               0.16280          0.2572   
 566            0.30940          0.34030               0.14180          0.2218   
 567            0.86810          0.93870               0.26500          0.4087   
 568            0.06444          0.00000               0.00000          0.2871   
 
      worst fractal dimension  
 0                    0.11890  
 1                    0.08902  
 2                    0.08758  
 3                    0.17300  
 4                    0.07678  
 5                    0.12440  
 6                    0.08368  
 7                    0.11510  
 8                    0.10720  
 9                    0.20750  
 10                   0.08452  
 11                   0.10480  
 12                   0.10230  
 13                   0.06287  
 14                   0.14310  
 15                   0.13410  
 16                   0.08216  
 17                   0.11420  
 18                   0.07615  
 19                   0.07259  
 20                   0.08183  
 21                   0.07773  
 22                   0.09946  
 23                   0.07526  
 24                   0.09564  
 25                   0.10590  
 26                   0.12750  
 27                   0.07421  
 28                   0.09876  
 29                   0.07919  
 ..                       ...  
 539                  0.10660  
 540                  0.08134  
 541                  0.10230  
 542                  0.06956  
 543                  0.06443  
 544                  0.08492  
 545                  0.06953  
 546                  0.07399  
 547                  0.09479  
 548                  0.07920  
 549                  0.07626  
 550                  0.06592  
 551                  0.08032  
 552                  0.06484  
 553                  0.07393  
 554                  0.07242  
 555                  0.08283  
 556                  0.06742  
 557                  0.06969  
 558                  0.08004  
 559                  0.08732  
 560                  0.08321  
 561                  0.05905  
 562                  0.14090  
 563                  0.09873  
 564                  0.07115  
 565                  0.06637  
 566                  0.07820  
 567                  0.12400  
 568                  0.07039  
 
 [569 rows x 30 columns], 0      0
 1      0
 2      0
 3      0
 4      0
 5      0
 6      0
 7      0
 8      0
 9      0
 10     0
 11     0
 12     0
 13     0
 14     0
 15     0
 16     0
 17     0
 18     0
 19     1
 20     1
 21     1
 22     0
 23     0
 24     0
 25     0
 26     0
 27     0
 28     0
 29     0
       ..
 539    1
 540    1
 541    1
 542    1
 543    1
 544    1
 545    1
 546    1
 547    1
 548    1
 549    1
 550    1
 551    1
 552    1
 553    1
 554    1
 555    1
 556    1
 557    1
 558    1
 559    1
 560    1
 561    1
 562    0
 563    0
 564    0
 565    0
 566    0
 567    0
 568    1
 Name: target, Length: 569, dtype: int64)

Question 4

Using train_test_split, split X and y into training and test sets (X_train, X_test, y_train, and y_test).

Set the random number generator state to 0 using random_state=0 to make sure your results match the autograder!

This function should return a tuple of length 4: (X_train, X_test, y_train, y_test), where

  • X_train has shape (426, 30)
  • X_test has shape (143, 30)
  • y_train has shape (426,)
  • y_test has shape (143,)
In [105]:
from sklearn.model_selection import train_test_split

def answer_four():
    X, y = answer_three()
    
    # Your code here
    X_train, X_test, y_train, y_test = train_test_split(X, y, test_size = 0.25, random_state = 0)
    return X_train, X_test, y_train, y_test
answer_four()
Out[105]:
(     mean radius  mean texture  mean perimeter  mean area  mean smoothness  \
 293       11.850         17.46           75.54      432.7          0.08372   
 332       11.220         19.86           71.94      387.3          0.10540   
 565       20.130         28.25          131.20     1261.0          0.09780   
 278       13.590         17.84           86.24      572.3          0.07948   
 489       16.690         20.20          107.10      857.6          0.07497   
 346       12.060         18.90           76.66      445.3          0.08386   
 357       13.870         16.21           88.52      593.7          0.08743   
 355       12.560         19.07           81.92      485.8          0.08760   
 112       14.260         19.65           97.83      629.9          0.07837   
 68         9.029         17.33           58.79      250.5          0.10660   
 526       13.460         18.75           87.44      551.1          0.10750   
 206        9.876         17.27           62.92      295.4          0.10890   
 65        14.780         23.94           97.40      668.3          0.11720   
 437       14.040         15.98           89.78      611.2          0.08458   
 126       13.610         24.69           87.76      572.6          0.09258   
 429       12.720         17.67           80.98      501.3          0.07896   
 392       15.490         19.97          102.40      744.7          0.11600   
 343       19.680         21.68          129.90     1194.0          0.09797   
 334       12.300         19.02           77.88      464.4          0.08313   
 440       10.970         17.20           71.73      371.5          0.08915   
 441       17.270         25.42          112.40      928.8          0.08331   
 137       11.430         15.39           73.06      399.8          0.09639   
 230       17.050         19.08          113.40      895.0          0.11410   
 7         13.710         20.83           90.20      577.9          0.11890   
 408       17.990         20.66          117.80      991.7          0.10360   
 523       13.710         18.68           88.73      571.0          0.09916   
 361       13.300         21.57           85.24      546.1          0.08582   
 553        9.333         21.94           59.01      264.0          0.09240   
 478       11.490         14.59           73.99      404.9          0.10460   
 303       10.490         18.61           66.86      334.3          0.10680   
 ..           ...           ...             ...        ...              ...   
 459        9.755         28.20           61.68      290.9          0.07984   
 510       11.740         14.69           76.31      426.0          0.08099   
 151        8.219         20.70           53.27      203.9          0.09405   
 244       19.400         23.50          129.10     1155.0          0.10270   
 543       13.210         28.06           84.88      538.4          0.08671   
 544       13.870         20.70           89.77      584.8          0.09578   
 265       20.730         31.12          135.70     1419.0          0.09469   
 288       11.260         19.96           73.72      394.1          0.08020   
 423       13.660         19.13           89.46      575.3          0.09057   
 147       14.950         18.77           97.84      689.5          0.08138   
 177       16.460         20.11          109.30      832.9          0.09831   
 99        14.420         19.77           94.48      642.5          0.09752   
 448       14.530         19.34           94.25      659.7          0.08388   
 431       12.400         17.68           81.47      467.8          0.10540   
 115       11.930         21.53           76.53      438.6          0.09768   
 72        17.200         24.52          114.20      929.4          0.10710   
 537       11.690         24.44           76.37      406.4          0.12360   
 174       10.660         15.15           67.49      349.6          0.08792   
 87        19.020         24.59          122.00     1076.0          0.09029   
 551       11.130         22.44           71.49      378.4          0.09566   
 486       14.640         16.85           94.21      666.0          0.08641   
 314        8.597         18.60           54.09      221.2          0.10740   
 396       13.510         18.89           88.10      558.1          0.10590   
 472       14.920         14.93           96.45      686.9          0.08098   
 70        18.940         21.31          123.60     1130.0          0.09009   
 277       18.810         19.98          120.90     1102.0          0.08923   
 9         12.460         24.04           83.97      475.9          0.11860   
 359        9.436         18.32           59.82      278.6          0.10090   
 192        9.720         18.22           60.73      288.1          0.06950   
 559       11.510         23.93           74.52      403.5          0.09261   
 
      mean compactness  mean concavity  mean concave points  mean symmetry  \
 293           0.05642        0.026880             0.022800         0.1875   
 332           0.06779        0.005006             0.007583         0.1940   
 565           0.10340        0.144000             0.097910         0.1752   
 278           0.04052        0.019970             0.012380         0.1573   
 489           0.07112        0.036490             0.023070         0.1846   
 346           0.05794        0.007510             0.008488         0.1555   
 357           0.05492        0.015020             0.020880         0.1424   
 355           0.10380        0.103000             0.043910         0.1533   
 112           0.22330        0.300300             0.077980         0.1704   
 68            0.14130        0.313000             0.043750         0.2111   
 526           0.11380        0.042010             0.031520         0.1723   
 206           0.07232        0.017560             0.019520         0.1934   
 65            0.14790        0.126700             0.090290         0.1953   
 437           0.05895        0.035340             0.029440         0.1714   
 126           0.07862        0.052850             0.030850         0.1761   
 429           0.04522        0.014020             0.018350         0.1459   
 392           0.15620        0.189100             0.091130         0.1929   
 343           0.13390        0.186300             0.110300         0.2082   
 334           0.04202        0.007756             0.008535         0.1539   
 440           0.11130        0.094570             0.036130         0.1489   
 441           0.11090        0.120400             0.057360         0.1467   
 137           0.06889        0.035030             0.028750         0.1734   
 230           0.15720        0.191000             0.109000         0.2131   
 7             0.16450        0.093660             0.059850         0.2196   
 408           0.13040        0.120100             0.088240         0.1992   
 523           0.10700        0.053850             0.037830         0.1714   
 361           0.06373        0.033440             0.024240         0.1815   
 553           0.05605        0.039960             0.012820         0.1692   
 478           0.08228        0.053080             0.019690         0.1779   
 303           0.06678        0.022970             0.017800         0.1482   
 ..                ...             ...                  ...            ...   
 459           0.04626        0.015410             0.010430         0.1621   
 510           0.09661        0.067260             0.026390         0.1499   
 151           0.13050        0.132100             0.021680         0.2222   
 244           0.15580        0.204900             0.088860         0.1978   
 543           0.06877        0.029870             0.032750         0.1628   
 544           0.10180        0.036880             0.023690         0.1620   
 265           0.11430        0.136700             0.086460         0.1769   
 288           0.11810        0.092740             0.055880         0.2595   
 423           0.11470        0.096570             0.048120         0.1848   
 147           0.11670        0.090500             0.035620         0.1744   
 177           0.15560        0.179300             0.088660         0.1794   
 99            0.11410        0.093880             0.058390         0.1879   
 448           0.07800        0.088170             0.029250         0.1473   
 431           0.13160        0.077410             0.027990         0.1811   
 115           0.07849        0.033280             0.020080         0.1688   
 72            0.18300        0.169200             0.079440         0.1927   
 537           0.15520        0.045150             0.045310         0.2131   
 174           0.04302        0.000000             0.000000         0.1928   
 87            0.12060        0.146800             0.082710         0.1953   
 551           0.08194        0.048240             0.022570         0.2030   
 486           0.06698        0.051920             0.027910         0.1409   
 314           0.05847        0.000000             0.000000         0.2163   
 396           0.11470        0.085800             0.053810         0.1806   
 472           0.08549        0.055390             0.032210         0.1687   
 70            0.10290        0.108000             0.079510         0.1582   
 277           0.05884        0.080200             0.058430         0.1550   
 9             0.23960        0.227300             0.085430         0.2030   
 359           0.05956        0.027100             0.014060         0.1506   
 192           0.02344        0.000000             0.000000         0.1653   
 559           0.10210        0.111200             0.041050         0.1388   
 
      mean fractal dimension           ...             worst radius  \
 293                 0.05715           ...                   13.060   
 332                 0.06028           ...                   11.980   
 565                 0.05533           ...                   23.690   
 278                 0.05520           ...                   15.500   
 489                 0.05325           ...                   19.180   
 346                 0.06048           ...                   13.640   
 357                 0.05883           ...                   15.110   
 355                 0.06184           ...                   13.370   
 112                 0.07769           ...                   15.300   
 68                  0.08046           ...                   10.310   
 526                 0.06317           ...                   15.350   
 206                 0.06285           ...                   10.420   
 65                  0.06654           ...                   17.310   
 437                 0.05898           ...                   15.660   
 126                 0.06130           ...                   16.890   
 429                 0.05544           ...                   13.820   
 392                 0.06744           ...                   21.200   
 343                 0.05715           ...                   22.750   
 334                 0.05945           ...                   13.350   
 440                 0.06640           ...                   12.360   
 441                 0.05407           ...                   20.380   
 137                 0.05865           ...                   12.320   
 230                 0.06325           ...                   19.590   
 7                   0.07451           ...                   17.060   
 408                 0.06069           ...                   21.080   
 523                 0.06843           ...                   15.110   
 361                 0.05696           ...                   14.200   
 553                 0.06576           ...                    9.845   
 478                 0.06574           ...                   12.400   
 303                 0.06600           ...                   11.060   
 ..                      ...           ...                      ...   
 459                 0.05952           ...                   10.670   
 510                 0.06758           ...                   12.450   
 151                 0.08261           ...                    9.092   
 244                 0.06000           ...                   21.650   
 543                 0.05781           ...                   14.370   
 544                 0.06688           ...                   15.050   
 265                 0.05674           ...                   32.490   
 288                 0.06233           ...                   11.860   
 423                 0.06181           ...                   15.140   
 147                 0.06493           ...                   16.250   
 177                 0.06323           ...                   17.790   
 99                  0.06390           ...                   16.330   
 448                 0.05746           ...                   16.300   
 431                 0.07102           ...                   12.880   
 115                 0.06194           ...                   13.670   
 72                  0.06487           ...                   23.320   
 537                 0.07405           ...                   12.980   
 174                 0.05975           ...                   11.540   
 87                  0.05629           ...                   24.560   
 551                 0.06552           ...                   12.020   
 486                 0.05355           ...                   16.460   
 314                 0.07359           ...                    8.952   
 396                 0.06079           ...                   14.800   
 472                 0.05669           ...                   17.180   
 70                  0.05461           ...                   24.860   
 277                 0.04996           ...                   19.960   
 9                   0.08243           ...                   15.090   
 359                 0.06959           ...                   12.020   
 192                 0.06447           ...                    9.968   
 559                 0.06570           ...                   12.480   
 
      worst texture  worst perimeter  worst area  worst smoothness  \
 293          25.75            84.35       517.8           0.13690   
 332          25.78            76.91       436.1           0.14240   
 565          38.25           155.00      1731.0           0.11660   
 278          26.10            98.91       739.1           0.10500   
 489          26.56           127.30      1084.0           0.10090   
 346          27.06            86.54       562.6           0.12890   
 357          25.58            96.74       694.4           0.11530   
 355          22.43            89.02       547.4           0.10960   
 112          23.73           107.00       709.0           0.08949   
 68           22.65            65.50       324.7           0.14820   
 526          25.16           101.90       719.8           0.16240   
 206          23.22            67.08       331.6           0.14150   
 65           33.39           114.60       925.1           0.16480   
 437          21.58           101.20       750.0           0.11950   
 126          35.64           113.20       848.7           0.14710   
 429          20.96            88.87       586.8           0.10680   
 392          29.41           142.10      1359.0           0.16810   
 343          34.66           157.60      1540.0           0.12180   
 334          28.46            84.53       544.3           0.12220   
 440          26.87            90.14       476.4           0.13910   
 441          35.46           132.80      1284.0           0.14360   
 137          22.02            79.93       462.0           0.11900   
 230          24.89           133.50      1189.0           0.17030   
 7            28.14           110.60       897.0           0.16540   
 408          25.41           138.10      1349.0           0.14820   
 523          25.63            99.43       701.9           0.14250   
 361          29.20            92.94       621.2           0.11400   
 553          25.05            62.86       295.8           0.11030   
 478          21.90            82.04       467.6           0.13520   
 303          24.54            70.76       375.4           0.14130   
 ..             ...              ...         ...               ...   
 459          36.92            68.03       349.9           0.11100   
 510          17.60            81.25       473.8           0.10730   
 151          29.72            58.08       249.8           0.16300   
 244          30.53           144.90      1417.0           0.14630   
 543          37.17            92.48       629.6           0.10720   
 544          24.75            99.17       688.6           0.12640   
 265          47.16           214.00      3432.0           0.14010   
 288          22.33            78.27       437.6           0.10280   
 423          25.50           101.40       708.8           0.11470   
 147          25.47           107.10       809.7           0.09970   
 177          28.45           123.50       981.2           0.14150   
 99           30.86           109.50       826.4           0.14310   
 448          28.39           108.10       830.5           0.10890   
 431          22.91            89.61       515.8           0.14500   
 115          26.15            87.54       583.0           0.15000   
 72           33.82           151.60      1681.0           0.15850   
 537          32.19            86.12       487.7           0.17680   
 174          19.20            73.20       408.3           0.10760   
 87           30.41           152.90      1623.0           0.12490   
 551          28.26            77.80       436.6           0.10870   
 486          25.44           106.00       831.0           0.11420   
 314          22.44            56.65       240.1           0.13470   
 396          27.20            97.33       675.2           0.14280   
 472          18.22           112.00       906.6           0.10650   
 70           26.58           165.90      1866.0           0.11930   
 277          24.30           129.00      1236.0           0.12430   
 9            40.68            97.65       711.4           0.18530   
 359          25.02            75.79       439.6           0.13330   
 192          20.83            62.25       303.8           0.07117   
 559          37.16            82.28       474.2           0.12980   
 
      worst compactness  worst concavity  worst concave points  worst symmetry  \
 293            0.17580          0.13160               0.09140          0.3101   
 332            0.09669          0.01335               0.02022          0.3292   
 565            0.19220          0.32150               0.16280          0.2572   
 278            0.07622          0.10600               0.05185          0.2335   
 489            0.29200          0.24770               0.08737          0.4677   
 346            0.13520          0.04506               0.05093          0.2880   
 357            0.10080          0.05285               0.05556          0.2362   
 355            0.20020          0.23880               0.09265          0.2121   
 112            0.41930          0.67830               0.15050          0.2398   
 68             0.43650          1.25200               0.17500          0.4228   
 526            0.31240          0.26540               0.14270          0.3518   
 206            0.12470          0.06213               0.05588          0.2989   
 65             0.34160          0.30240               0.16140          0.3321   
 437            0.12520          0.11170               0.07453          0.2725   
 126            0.28840          0.37960               0.13290          0.3470   
 429            0.09605          0.03469               0.03612          0.2165   
 392            0.39130          0.55530               0.21210          0.3187   
 343            0.34580          0.47340               0.22550          0.4045   
 334            0.09052          0.03619               0.03983          0.2554   
 440            0.40820          0.47790               0.15550          0.2540   
 441            0.41220          0.50360               0.17390          0.2500   
 137            0.16480          0.13990               0.08476          0.2676   
 230            0.39340          0.50180               0.25430          0.3109   
 7              0.36820          0.26780               0.15560          0.3196   
 408            0.37350          0.33010               0.19740          0.3060   
 523            0.25660          0.19350               0.12840          0.2849   
 361            0.16670          0.12120               0.05614          0.2637   
 553            0.08298          0.07993               0.02564          0.2435   
 478            0.20100          0.25960               0.07431          0.2941   
 303            0.10440          0.08423               0.06528          0.2213   
 ..                 ...              ...                   ...             ...   
 459            0.11090          0.07190               0.04866          0.2321   
 510            0.27930          0.26900               0.10560          0.2604   
 151            0.43100          0.53810               0.07879          0.3322   
 244            0.29680          0.34580               0.15640          0.2920   
 543            0.13810          0.10620               0.07958          0.2473   
 544            0.20370          0.13770               0.06845          0.2249   
 265            0.26440          0.34420               0.16590          0.2868   
 288            0.18430          0.15460               0.09314          0.2955   
 423            0.31670          0.36600               0.14070          0.2744   
 147            0.25210          0.25000               0.08405          0.2852   
 177            0.46670          0.58620               0.20350          0.3054   
 99             0.30260          0.31940               0.15650          0.2718   
 448            0.26490          0.37790               0.09594          0.2471   
 431            0.26290          0.24030               0.07370          0.2556   
 115            0.23990          0.15030               0.07247          0.2438   
 72             0.73940          0.65660               0.18990          0.3313   
 537            0.32510          0.13950               0.13080          0.2803   
 174            0.06791          0.00000               0.00000          0.2710   
 87             0.32060          0.57550               0.19560          0.3956   
 551            0.17820          0.15640               0.06413          0.3169   
 486            0.20700          0.24370               0.07828          0.2455   
 314            0.07767          0.00000               0.00000          0.3142   
 396            0.25700          0.34380               0.14530          0.2666   
 472            0.27910          0.31510               0.11470          0.2688   
 70             0.23360          0.26870               0.17890          0.2551   
 277            0.11600          0.22100               0.12940          0.2567   
 9              1.05800          1.10500               0.22100          0.4366   
 359            0.10490          0.11440               0.05052          0.2454   
 192            0.02729          0.00000               0.00000          0.1909   
 559            0.25170          0.36300               0.09653          0.2112   
 
      worst fractal dimension  
 293                  0.07007  
 332                  0.06522  
 565                  0.06637  
 278                  0.06263  
 489                  0.07623  
 346                  0.08083  
 357                  0.07113  
 355                  0.07188  
 112                  0.10820  
 68                   0.11750  
 526                  0.08665  
 206                  0.07380  
 65                   0.08911  
 437                  0.07234  
 126                  0.07900  
 429                  0.06025  
 392                  0.10190  
 343                  0.07918  
 334                  0.07207  
 440                  0.09532  
 441                  0.07944  
 137                  0.06765  
 230                  0.09061  
 7                    0.11510  
 408                  0.08503  
 523                  0.09031  
 361                  0.06658  
 553                  0.07393  
 478                  0.09180  
 303                  0.07842  
 ..                       ...  
 459                  0.07211  
 510                  0.09879  
 151                  0.14860  
 244                  0.07614  
 543                  0.06443  
 544                  0.08492  
 265                  0.08218  
 288                  0.07009  
 423                  0.08839  
 147                  0.09218  
 177                  0.09519  
 99                   0.09353  
 448                  0.07463  
 431                  0.09359  
 115                  0.08541  
 72                   0.13390  
 537                  0.09970  
 174                  0.06164  
 87                   0.09288  
 551                  0.08032  
 486                  0.06596  
 314                  0.08116  
 396                  0.07686  
 472                  0.08273  
 70                   0.06589  
 277                  0.05737  
 9                    0.20750  
 359                  0.08136  
 192                  0.06559  
 559                  0.08732  
 
 [426 rows x 30 columns],
      mean radius  mean texture  mean perimeter  mean area  mean smoothness  \
 512       13.400         20.52           88.64      556.7          0.11060   
 457       13.210         25.25           84.10      537.9          0.08791   
 439       14.020         15.66           89.59      606.5          0.07966   
 298       14.260         18.17           91.22      633.1          0.06576   
 37        13.030         18.42           82.61      523.8          0.08983   
 515       11.340         18.61           72.76      391.2          0.10490   
 382       12.050         22.72           78.75      447.8          0.06935   
 310       11.700         19.11           74.33      418.7          0.08814   
 538        7.729         25.49           47.98      178.8          0.08098   
 345       10.260         14.71           66.20      321.6          0.09882   
 421       14.690         13.98           98.22      656.1          0.10310   
 90        14.620         24.02           94.57      662.7          0.08974   
 412        9.397         21.68           59.75      268.8          0.07969   
 157       16.840         19.46          108.40      880.2          0.07445   
 89        14.640         15.24           95.77      651.9          0.11320   
 172       15.460         11.89          102.50      736.9          0.12570   
 318        9.042         18.90           60.07      244.5          0.09968   
 233       20.510         27.81          134.40     1319.0          0.09159   
 389       19.550         23.21          128.90     1174.0          0.10100   
 250       20.940         23.56          138.90     1364.0          0.10070   
 31        11.840         18.70           77.93      440.6          0.11090   
 283       16.240         18.77          108.80      805.1          0.10660   
 482       13.470         14.06           87.32      546.3          0.10710   
 211       11.840         18.94           75.51      428.0          0.08871   
 372       21.370         15.10          141.30     1386.0          0.10010   
 401       11.930         10.91           76.14      442.7          0.08872   
 159       10.900         12.96           68.69      366.8          0.07515   
 14        13.730         22.61           93.60      578.3          0.11310   
 364       13.400         16.95           85.48      552.4          0.07937   
 337       18.770         21.43          122.90     1092.0          0.09116   
 ..           ...           ...             ...        ...              ...   
 500       15.040         16.74           98.73      689.4          0.09883   
 338       10.050         17.53           64.41      310.8          0.10070   
 427       10.800         21.98           68.79      359.9          0.08801   
 406       16.140         14.86          104.30      800.0          0.09495   
 96        12.180         17.84           77.79      451.1          0.10450   
 490       12.250         22.44           78.18      466.5          0.08192   
 384       13.280         13.72           85.79      541.8          0.08363   
 281       11.740         14.02           74.24      427.3          0.07813   
 325       12.670         17.30           81.25      489.9          0.10280   
 190       14.220         23.12           94.37      609.9          0.10750   
 380       11.270         12.96           73.16      386.3          0.12370   
 366       20.200         26.83          133.70     1234.0          0.09905   
 469       11.620         18.18           76.38      408.8          0.11750   
 225       14.340         13.47           92.51      641.2          0.09906   
 271       11.290         13.04           72.23      388.0          0.09834   
 547       10.260         16.58           65.85      320.8          0.08877   
 550       10.860         21.48           68.51      360.5          0.07431   
 492       18.010         20.56          118.40     1007.0          0.10010   
 185       10.080         15.11           63.76      317.5          0.09267   
 306       13.200         15.82           84.07      537.3          0.08511   
 208       13.110         22.54           87.02      529.4          0.10020   
 242       11.300         18.19           73.93      389.4          0.09592   
 313       11.540         10.72           73.73      409.1          0.08597   
 542       14.740         25.42           94.70      668.6          0.08275   
 514       15.050         19.07           97.26      701.9          0.09215   
 236       23.210         26.97          153.50     1670.0          0.09509   
 113       10.510         20.19           68.64      334.2          0.11220   
 527       12.340         12.27           78.94      468.5          0.09003   
 76        13.530         10.94           87.91      559.2          0.12910   
 162       19.590         18.15          130.70     1214.0          0.11200   
 
      mean compactness  mean concavity  mean concave points  mean symmetry  \
 512           0.14690        0.144500             0.081720         0.2116   
 457           0.05205        0.027720             0.020680         0.1619   
 439           0.05581        0.020870             0.026520         0.1589   
 298           0.05220        0.024750             0.013740         0.1635   
 37            0.03766        0.025620             0.029230         0.1467   
 515           0.08499        0.043020             0.025940         0.1927   
 382           0.10730        0.079430             0.029780         0.1203   
 310           0.05253        0.015830             0.011480         0.1936   
 538           0.04878        0.000000             0.000000         0.1870   
 345           0.09159        0.035810             0.020370         0.1633   
 421           0.18360        0.145000             0.063000         0.2086   
 90            0.08606        0.031020             0.029570         0.1685   
 412           0.06053        0.037350             0.005128         0.1274   
 157           0.07223        0.051500             0.027710         0.1844   
 89            0.13390        0.099660             0.070640         0.2116   
 172           0.15550        0.203200             0.109700         0.1966   
 318           0.19720        0.197500             0.049080         0.2330   
 233           0.10740        0.155400             0.083400         0.1448   
 389           0.13180        0.185600             0.102100         0.1989   
 250           0.16060        0.271200             0.131000         0.2205   
 31            0.15160        0.121800             0.051820         0.2301   
 283           0.18020        0.194800             0.090520         0.1876   
 482           0.11550        0.057860             0.052660         0.1779   
 211           0.06900        0.026690             0.013930         0.1533   
 372           0.15150        0.193200             0.125500         0.1973   
 401           0.05242        0.026060             0.017960         0.1601   
 159           0.03718        0.003090             0.006588         0.1442   
 14            0.22930        0.212800             0.080250         0.2069   
 364           0.05696        0.021810             0.014730         0.1650   
 337           0.14020        0.106000             0.060900         0.1953   
 ..                ...             ...                  ...            ...   
 500           0.13640        0.077210             0.061420         0.1668   
 338           0.07326        0.025110             0.017750         0.1890   
 427           0.05743        0.036140             0.014040         0.2016   
 406           0.08501        0.055000             0.045280         0.1735   
 96            0.07057        0.024900             0.029410         0.1900   
 490           0.05200        0.017140             0.012610         0.1544   
 384           0.08575        0.050770             0.028640         0.1617   
 281           0.04340        0.022450             0.027630         0.2101   
 325           0.07664        0.031930             0.021070         0.1707   
 190           0.24130        0.198100             0.066180         0.2384   
 380           0.11110        0.079000             0.055500         0.2018   
 366           0.16690        0.164100             0.126500         0.1875   
 469           0.14830        0.102000             0.055640         0.1957   
 225           0.07624        0.057240             0.046030         0.2075   
 271           0.07608        0.032650             0.027550         0.1769   
 547           0.08066        0.043580             0.024380         0.1669   
 550           0.04227        0.000000             0.000000         0.1661   
 492           0.12890        0.117000             0.077620         0.2116   
 185           0.04695        0.001597             0.002404         0.1703   
 306           0.05251        0.001461             0.003261         0.1632   
 208           0.14830        0.087050             0.051020         0.1850   
 242           0.13250        0.154800             0.028540         0.2054   
 313           0.05969        0.013670             0.008907         0.1833   
 542           0.07214        0.041050             0.030270         0.1840   
 514           0.08597        0.074860             0.043350         0.1561   
 236           0.16820        0.195000             0.123700         0.1909   
 113           0.13030        0.064760             0.030680         0.1922   
 527           0.06307        0.029580             0.026470         0.1689   
 76            0.10470        0.068770             0.065560         0.2403   
 162           0.16660        0.250800             0.128600         0.2027   
 
      mean fractal dimension           ...             worst radius  \
 512                 0.07325           ...                   16.410   
 457                 0.05584           ...                   14.350   
 439                 0.05586           ...                   14.910   
 298                 0.05586           ...                   16.220   
 37                  0.05863           ...                   13.300   
 515                 0.06211           ...                   12.470   
 382                 0.06659           ...                   12.570   
 310                 0.06128           ...                   12.610   
 538                 0.07285           ...                    9.077   
 345                 0.07005           ...                   10.880   
 421                 0.07406           ...                   16.460   
 90                  0.05866           ...                   16.110   
 412                 0.06724           ...                    9.965   
 157                 0.05268           ...                   18.220   
 89                  0.06346           ...                   16.340   
 172                 0.07069           ...                   18.790   
 318                 0.08743           ...                   10.060   
 233                 0.05592           ...                   24.470   
 389                 0.05884           ...                   20.820   
 250                 0.05898           ...                   25.580   
 31                  0.07799           ...                   16.820   
 283                 0.06684           ...                   18.550   
 482                 0.06639           ...                   14.830   
 211                 0.06057           ...                   13.300   
 372                 0.06183           ...                   22.690   
 401                 0.05541           ...                   13.800   
 159                 0.05743           ...                   12.360   
 14                  0.07682           ...                   15.030   
 364                 0.05701           ...                   14.730   
 337                 0.06083           ...                   24.540   
 ..                      ...           ...                      ...   
 500                 0.06869           ...                   16.760   
 338                 0.06331           ...                   11.160   
 427                 0.05977           ...                   12.760   
 406                 0.05875           ...                   17.710   
 96                  0.06635           ...                   12.830   
 490                 0.05976           ...                   14.170   
 384                 0.05594           ...                   14.240   
 281                 0.06113           ...                   13.310   
 325                 0.05984           ...                   13.710   
 190                 0.07542           ...                   15.740   
 380                 0.06914           ...                   12.840   
 366                 0.06020           ...                   24.190   
 469                 0.07255           ...                   13.360   
 225                 0.05448           ...                   16.770   
 271                 0.06270           ...                   12.320   
 547                 0.06714           ...                   10.830   
 550                 0.05948           ...                   11.660   
 492                 0.06077           ...                   21.530   
 185                 0.06048           ...                   11.870   
 306                 0.05894           ...                   14.410   
 208                 0.07310           ...                   14.550   
 242                 0.07669           ...                   12.580   
 313                 0.06100           ...                   12.340   
 542                 0.05680           ...                   16.510   
 514                 0.05915           ...                   17.580   
 236                 0.06309           ...                   31.010   
 113                 0.07782           ...                   11.160   
 527                 0.05808           ...                   13.610   
 76                  0.06641           ...                   14.080   
 162                 0.06082           ...                   26.730   
 
      worst texture  worst perimeter  worst area  worst smoothness  \
 512          29.66           113.30       844.4           0.15740   
 457          34.23            91.29       632.9           0.12890   
 439          19.31            96.53       688.9           0.10340   
 298          25.26           105.80       819.7           0.09445   
 37           22.81            84.46       545.9           0.09701   
 515          23.03            79.15       478.6           0.14830   
 382          28.71            87.36       488.4           0.08799   
 310          26.55            80.92       483.1           0.12230   
 538          30.92            57.17       248.0           0.12560   
 345          19.48            70.89       357.1           0.13600   
 421          18.34           114.10       809.2           0.13120   
 90           29.11           102.90       803.7           0.11150   
 412          27.99            66.61       301.0           0.10860   
 157          28.07           120.30      1032.0           0.08774   
 89           18.24           109.40       803.6           0.12770   
 172          17.04           125.00      1102.0           0.15310   
 318          23.40            68.62       297.1           0.12210   
 233          37.38           162.70      1872.0           0.12230   
 389          30.44           142.00      1313.0           0.12510   
 250          27.00           165.30      2010.0           0.12110   
 31           28.12           119.40       888.7           0.16370   
 283          25.09           126.90      1031.0           0.13650   
 482          18.32            94.94       660.2           0.13930   
 211          24.99            85.22       546.3           0.12800   
 372          21.84           152.10      1535.0           0.11920   
 401          20.14            87.64       589.5           0.13740   
 159          18.20            78.07       470.0           0.11710   
 14           32.01           108.80       697.7           0.16510   
 364          21.70            93.76       663.5           0.12130   
 337          34.37           161.10      1873.0           0.14980   
 ..             ...              ...         ...               ...   
 500          20.43           109.70       856.9           0.11350   
 338          26.84            71.98       384.0           0.14020   
 427          32.04            83.69       489.5           0.13030   
 406          19.58           115.90       947.9           0.12060   
 96           20.92            82.14       495.2           0.11400   
 490          31.99            92.74       622.9           0.12560   
 384          17.37            96.59       623.7           0.11660   
 281          18.26            84.70       533.7           0.10360   
 325          21.10            88.70       574.4           0.13840   
 190          37.18           106.40       762.4           0.15330   
 380          20.53            84.93       476.1           0.16100   
 366          33.81           160.00      1671.0           0.12780   
 469          25.40            88.14       528.1           0.17800   
 225          16.90           110.40       873.2           0.12970   
 271          16.18            78.27       457.5           0.13580   
 547          22.04            71.08       357.4           0.14610   
 550          24.77            74.08       412.3           0.10010   
 492          26.06           143.40      1426.0           0.13090   
 185          21.18            75.39       437.0           0.15210   
 306          20.45            92.00       636.9           0.11280   
 208          29.16            99.48       639.3           0.13490   
 242          27.96            87.16       472.9           0.13470   
 313          12.87            81.23       467.8           0.10920   
 542          32.29           107.40       826.4           0.10600   
 514          28.06           113.80       967.0           0.12460   
 236          34.51           206.00      2944.0           0.14810   
 113          22.75            72.62       374.4           0.13000   
 527          19.27            87.22       564.9           0.12920   
 76           12.49            91.36       605.5           0.14510   
 162          26.39           174.90      2232.0           0.14380   
 
      worst compactness  worst concavity  worst concave points  worst symmetry  \
 512            0.38560          0.51060               0.20510          0.3585   
 457            0.10630          0.13900               0.06005          0.2444   
 439            0.10170          0.06260               0.08216          0.2136   
 298            0.21670          0.15650               0.07530          0.2636   
 37             0.04619          0.04833               0.05013          0.1987   
 515            0.15740          0.16240               0.08542          0.3060   
 382            0.32140          0.29120               0.10920          0.2191   
 310            0.10870          0.07915               0.05741          0.3487   
 538            0.08340          0.00000               0.00000          0.3058   
 345            0.16360          0.07162               0.04074          0.2434   
 421            0.36350          0.32190               0.11080          0.2827   
 90             0.17660          0.09189               0.06946          0.2522   
 412            0.18870          0.18680               0.02564          0.2376   
 157            0.17100          0.18820               0.08436          0.2527   
 89             0.30890          0.26040               0.13970          0.3151   
 172            0.35830          0.58300               0.18270          0.3216   
 318            0.37480          0.46090               0.11450          0.3135   
 233            0.27610          0.41460               0.15630          0.2437   
 389            0.24140          0.38290               0.18250          0.2576   
 250            0.31720          0.69910               0.21050          0.3126   
 31             0.57750          0.69560               0.15460          0.4761   
 283            0.47060          0.50260               0.17320          0.2770   
 482            0.24990          0.18480               0.13350          0.3227   
 211            0.18800          0.14710               0.06913          0.2535   
 372            0.28400          0.40240               0.19660          0.2730   
 401            0.15750          0.15140               0.06876          0.2460   
 159            0.08294          0.01854               0.03953          0.2738   
 14             0.77250          0.69430               0.22080          0.3596   
 364            0.16760          0.13640               0.06987          0.2741   
 337            0.48270          0.46340               0.20480          0.3679   
 ..                 ...              ...                   ...             ...   
 500            0.21760          0.18560               0.10180          0.2177   
 338            0.14020          0.10550               0.06499          0.2894   
 427            0.16960          0.19270               0.07485          0.2965   
 406            0.17220          0.23100               0.11290          0.2778   
 96             0.09358          0.04980               0.05882          0.2227   
 490            0.18040          0.12300               0.06335          0.3100   
 384            0.26850          0.28660               0.09173          0.2736   
 281            0.08500          0.06735               0.08290          0.3101   
 325            0.12120          0.10200               0.05602          0.2688   
 190            0.93270          0.84880               0.17720          0.5166   
 380            0.24290          0.22470               0.13180          0.3343   
 366            0.34160          0.37030               0.21520          0.3271   
 469            0.28780          0.31860               0.14160          0.2660   
 225            0.15250          0.16320               0.10870          0.3062   
 271            0.15070          0.12750               0.08750          0.2733   
 547            0.22460          0.17830               0.08333          0.2691   
 550            0.07348          0.00000               0.00000          0.2458   
 492            0.23270          0.25440               0.14890          0.3251   
 185            0.10190          0.00692               0.01042          0.2933   
 306            0.13460          0.01120               0.02500          0.2651   
 208            0.44020          0.31620               0.11260          0.4128   
 242            0.48480          0.74360               0.12180          0.3308   
 313            0.16260          0.08324               0.04715          0.3390   
 542            0.13760          0.16110               0.10950          0.2722   
 514            0.21010          0.28660               0.11200          0.2282   
 236            0.41260          0.58200               0.25930          0.3103   
 113            0.20490          0.12950               0.06136          0.2383   
 527            0.20740          0.17910               0.10700          0.3110   
 76             0.13790          0.08539               0.07407          0.2710   
 162            0.38460          0.68100               0.22470          0.3643   
 
      worst fractal dimension  
 512                  0.11090  
 457                  0.06788  
 439                  0.06710  
 298                  0.07676  
 37                   0.06169  
 515                  0.06783  
 382                  0.09349  
 310                  0.06958  
 538                  0.09938  
 345                  0.08488  
 421                  0.09208  
 90                   0.07246  
 412                  0.09206  
 157                  0.05972  
 89                   0.08473  
 172                  0.10100  
 318                  0.10550  
 233                  0.08328  
 389                  0.07602  
 250                  0.07849  
 31                   0.14020  
 283                  0.10630  
 482                  0.09326  
 211                  0.07993  
 372                  0.08666  
 401                  0.07262  
 159                  0.07685  
 14                   0.14310  
 364                  0.07582  
 337                  0.09870  
 ..                       ...  
 500                  0.08549  
 338                  0.07664  
 427                  0.07662  
 406                  0.07012  
 96                   0.07376  
 490                  0.08203  
 384                  0.07320  
 281                  0.06688  
 325                  0.06888  
 190                  0.14460  
 380                  0.09215  
 366                  0.07632  
 469                  0.09270  
 225                  0.06072  
 271                  0.08022  
 547                  0.09479  
 550                  0.06592  
 492                  0.07625  
 185                  0.07697  
 306                  0.08385  
 208                  0.10760  
 242                  0.12970  
 313                  0.07434  
 542                  0.06956  
 514                  0.06954  
 236                  0.08677  
 113                  0.09026  
 527                  0.07592  
 76                   0.07191  
 162                  0.09223  
 
 [143 rows x 30 columns],
 293    1
 332    1
 565    0
 278    1
 489    0
 346    1
 357    1
 355    1
 112    1
 68     1
 526    1
 206    1
 65     0
 437    1
 126    0
 429    1
 392    0
 343    0
 334    1
 440    1
 441    0
 137    1
 230    0
 7      0
 408    0
 523    1
 361    1
 553    1
 478    1
 303    1
       ..
 459    1
 510    1
 151    1
 244    0
 543    1
 544    1
 265    0
 288    1
 423    1
 147    1
 177    0
 99     0
 448    1
 431    1
 115    1
 72     0
 537    1
 174    1
 87     0
 551    1
 486    1
 314    1
 396    1
 472    1
 70     0
 277    0
 9      0
 359    1
 192    1
 559    1
 Name: target, Length: 426, dtype: int64,
 512    0
 457    1
 439    1
 298    1
 37     1
 515    1
 382    1
 310    1
 538    1
 345    1
 421    1
 90     1
 412    1
 157    1
 89     1
 172    0
 318    1
 233    0
 389    0
 250    0
 31     0
 283    0
 482    1
 211    1
 372    0
 401    1
 159    1
 14     0
 364    1
 337    0
       ..
 500    1
 338    1
 427    1
 406    1
 96     1
 490    1
 384    1
 281    1
 325    1
 190    0
 380    1
 366    0
 469    1
 225    1
 271    1
 547    1
 550    1
 492    0
 185    1
 306    1
 208    1
 242    1
 313    1
 542    1
 514    0
 236    0
 113    1
 527    1
 76     1
 162    0
 Name: target, Length: 143, dtype: int64)
In [79]:
np.floor(569*0.75)
Out[79]:
426.0

Question 5

Using KNeighborsClassifier, fit a k-nearest neighbors (knn) classifier with X_train, y_train and using one nearest neighbor (n_neighbors = 1).

This function should return a sklearn.neighbors.classification.KNeighborsClassifier.

In [106]:
from sklearn.neighbors import KNeighborsClassifier

def answer_five():
    X_train, X_test, y_train, y_test = answer_four()
    
    # Your code here
    knn = KNeighborsClassifier(n_neighbors = 1)
    answer = knn.fit(X_train, y_train)
    return knn# Return your answer

answer_five()
Out[106]:
KNeighborsClassifier(algorithm='auto', leaf_size=30, metric='minkowski',
           metric_params=None, n_jobs=1, n_neighbors=1, p=2,
           weights='uniform')

Question 6

Using your knn classifier, predict the class label using the mean value for each feature.

Hint: You can use cancerdf.mean()[:-1].values.reshape(1, -1) which gets the mean value for each feature, ignores the target column, and reshapes the data from 1 dimension to 2 (necessary for the precict method of KNeighborsClassifier).

This function should return a numpy array either array([ 0.]) or array([ 1.])

In [107]:
def answer_six():
    cancerdf = answer_one()
    means = cancerdf.mean()[:-1].values.reshape(1, -1)
    
    knn = KNeighborsClassifier(n_neighbors = 1)
    X_train, X_test, y_train, y_test = answer_four()
    knn.fit(X_train, y_train)
    means = cancerdf.mean()[:-1].values.reshape(1,-1)
    answer = knn.predict(means)
    return answer
answer_six()
Out[107]:
array([1])

Question 7

Using your knn classifier, predict the class labels for the test set X_test.

This function should return a numpy array with shape (143,) and values either 0.0 or 1.0.

In [109]:
def answer_seven():
    X_train, X_test, y_train, y_test = answer_four()
    knn = answer_five()
    answer = knn.predict(X_test)
    # Your code here
    
    return answer
answer_seven()
Out[109]:
array([1, 1, 1, 0, 1, 1, 1, 1, 1, 1, 0, 1, 1, 1, 0, 0, 1, 0, 0, 0, 0, 1, 1,
       1, 0, 1, 1, 1, 1, 0, 1, 0, 1, 0, 1, 0, 1, 0, 1, 0, 0, 1, 0, 1, 0, 0,
       1, 1, 1, 0, 0, 1, 0, 1, 1, 1, 1, 1, 1, 0, 0, 0, 1, 1, 0, 1, 0, 0, 0,
       1, 1, 0, 1, 1, 0, 1, 1, 1, 1, 1, 0, 0, 0, 1, 0, 1, 1, 1, 0, 0, 1, 0,
       1, 0, 1, 1, 0, 1, 1, 1, 1, 1, 1, 1, 0, 1, 0, 1, 0, 1, 1, 0, 0, 1, 1,
       1, 0, 1, 1, 1, 1, 1, 1, 1, 0, 1, 1, 1, 1, 1, 0, 1, 1, 1, 1, 1, 1, 0,
       0, 1, 1, 1, 0])

Question 8

Find the score (mean accuracy) of your knn classifier using X_test and y_test.

This function should return a float between 0 and 1

In [110]:
def answer_eight():
    X_train, X_test, y_train, y_test = answer_four()
    knn = answer_five()
    
    # Your code here
    answer = knn.score(X_test, y_test)
    return answer
answer_eight()
Out[110]:
0.91608391608391604

Optional plot

Try using the plotting function below to visualize the differet predicition scores between training and test sets, as well as malignant and benign cells.

In [111]:
def accuracy_plot():
    import matplotlib.pyplot as plt

    %matplotlib notebook

    X_train, X_test, y_train, y_test = answer_four()

    # Find the training and testing accuracies by target value (i.e. malignant, benign)
    mal_train_X = X_train[y_train==0]
    mal_train_y = y_train[y_train==0]
    ben_train_X = X_train[y_train==1]
    ben_train_y = y_train[y_train==1]

    mal_test_X = X_test[y_test==0]
    mal_test_y = y_test[y_test==0]
    ben_test_X = X_test[y_test==1]
    ben_test_y = y_test[y_test==1]

    knn = answer_five()

    scores = [knn.score(mal_train_X, mal_train_y), knn.score(ben_train_X, ben_train_y), 
              knn.score(mal_test_X, mal_test_y), knn.score(ben_test_X, ben_test_y)]


    plt.figure()

    # Plot the scores as a bar chart
    bars = plt.bar(np.arange(4), scores, color=['#4c72b0','#4c72b0','#55a868','#55a868'])

    # directly label the score onto the bars
    for bar in bars:
        height = bar.get_height()
        plt.gca().text(bar.get_x() + bar.get_width()/2, height*.90, '{0:.{1}f}'.format(height, 2), 
                     ha='center', color='w', fontsize=11)

    # remove all the ticks (both axes), and tick labels on the Y axis
    plt.tick_params(top='off', bottom='off', left='off', right='off', labelleft='off', labelbottom='on')

    # remove the frame of the chart
    for spine in plt.gca().spines.values():
        spine.set_visible(False)

    plt.xticks([0,1,2,3], ['Malignant\nTraining', 'Benign\nTraining', 'Malignant\nTest', 'Benign\nTest'], alpha=0.8);
    plt.title('Training and Test Accuracies for Malignant and Benign Cells', alpha=0.8)

Uncomment the plotting function to see the visualization.

Comment out the plotting function when submitting your notebook for grading.

In [112]:
accuracy_plot()