数据集:
https://www.kaggle.com/ronitf/heart-disease-uci
检查目标值print(data.target.value_counts())
1 165
0 138
Name: target, dtype: int64
sns.countplot(x='target',data=data)

target1 = len(data[data['target']==1])
target0 = len(data[data['target']==0])
NoHD = target0/len(data['target'])
IsHD = target1/len(data['target'])
0.45544554455445546 0.5445544554455446
年龄跟心脏病的分布pd.crosstab(data.age,data.target).plot(kind='bar',figsize=(18,6))
plt.title('Age distribution for heart attack')
plt.xticks(fontsize=20,rotation=45)
plt.xlabel('Age')
plt.ylabel('Frequency')
plt.savefig('Heartdisease.eps')#eps可以到AI里改美观一点&#

CristinaM 于 2019-04-23 21:39:23 发布
本文通过Kaggle上的心脏疾病数据集进行分析,展示了目标值分布,使用crosstab进行交叉表统计以探究年龄、性别、心率、slope、fbs和cp与心脏疾病的关系。同时,利用seaborn创建图表,发现有心脏病的人静息血压较低,并通过热力图进一步理解数据分布。 
