中国人民大学健康大数据研究院
科技助力教育研究,大数据和人工智能在教育科学研究中的应用 #生活知识# #生活感悟# #科技生活变迁# #科技对教育的影响#
(1)项目介绍
为了解全国居民对慢性病的认知及相关健康意识情况,“中国医疗消费和养老状况评价跟踪调查”组(CSPH)于2022年8月对全国18岁及以上人群进行了横断面调查,总样本为11508名。调查覆盖了31个省和自治区,采用电话调查和网络调查相结合的方式进行,调查过程考虑了年龄、性别的分布情况。
(2)数据库基本情况
数据库可划分为6大模块,分别为个体特征、健康行为、健康自评、健康意识、慢性病认知以及就医行为。具体结构见图1。表1-6列出了各个模块所对应的主要变量信息。
图1:数据集结构示意
表1:个体特征数据
模块
变量名称
变量含义
变量格式
变量类型
个体特征
省份
省份
字符串
分类
Q1_1
居住地
字符串
分类
Q1_2
城市/农村
数字
分类
Q1_3
性别
数字
分类
Q1_4
年龄
数字
连续
Q1_5
婚姻状况
数字
分类
Q1_6
最高受教育程度
数字
有序
Q1_7
职业
数字
分类
Q1_8
工作单位的性质
数字
分类
Q1_9
户口
数字
分类
Q1_10
居住地是否为户口所在地
数字
分类
Q1_13
身高
数字
连续
Q1_14
体重
数字
连续
Q1_15_1
是否拥有城镇职工医疗保险
字符串
分类
Q1_15_2
是否拥有城乡居民基本医疗保险
字符串
分类
Q1_15_3
是否拥有公费医疗
字符串
分类
Q1_15_4
是否拥有商业医疗保险
字符串
分类
Q1_15_6
没有医疗保险
字符串
分类
Q1_16_1
健康信息的主要渠道是-广播电视
字符串
分类
Q1_16_2
健康信息的主要渠道是-报刊杂志
字符串
分类
Q1_16_3
健康信息的主要渠道是-互联网
字符串
分类
Q1_16_4
健康信息的主要渠道是-手机中下载的APP等新媒体
字符串
分类
Q1_16_5
健康信息的主要渠道是-亲朋/街坊邻居
字符串
分类
Q1_16_6
健康信息的主要渠道是-医生(医疗机构)
字符串
分类
Q1_16_7
健康信息的主要渠道是-宣传栏及宣传手册
字符串
分类
Q1_17
包括您本人在内,家里的人数
数字
连续
Q1_18
个人税后年收入
数字
连续
Q1_19
家庭税后年总收入
数字
分类
表2:健康自评数据
模块
变量名称
变量含义
变量格式
变量类型
健康自评
Q1_11
个人健康状况自我评估
数字
分类
Q1_12
由于自身健康问题而日常活动受限的程度
数字
有序
Q4_20
过去一个月内是否经常感到情绪低落、孤独、做事很难集中精力
数字
有序
表3:慢性病认知数据
模块
变量名称
变量含义
变量格式
变量类型
慢性病认知
Q2_1_1
哪些属于慢性病-高血压
数字
分类
Q2_1_2
哪些属于慢性病-糖尿病
数字
分类
Q2_1_3
哪些属于慢性病-冠心病-
数字
分类
Q2_1_4
哪些属于慢性病-中风
数字
分类
Q2_1_5
哪些属于慢性病-肿瘤或癌症
数字
分类
Q2_1_6
哪些属于慢性病-破伤风
数字
分类
Q2_1_7
哪些属于慢性病-新型冠状病毒肺炎
数字
分类
Q2_2_1
慢性病是老年病
数字
分类
Q2_2_2
慢性病会传染
数字
分类
Q2_2_3
慢性病的发病和个人生活方式有很大关系
数字
分类
Q2_2_4
慢性病的治疗只能做到缓解症状,但是无法治愈疾病
数字
分类
Q2_2_5
慢性病患者要学习自我健康管理,控制相关危险因素
数字
分类
Q2_3
是否有慢性病
数字
分类
Q2_4_1
患有慢性病-高血压
字符串
分类
Q2_4_2
患有慢性病-高血脂
字符串
分类
Q2_4_3
患有慢性病-高血糖或糖尿病
字符串
分类
Q2_4_4
患有慢性病-肿瘤或癌症
字符串
分类
Q2_4_5
患有慢性病-慢性肺部疾患
字符串
分类
Q2_4_6
患有慢性病-心脏病
字符串
分类
Q2_4_7
患有慢性病-中风
字符串
分类
Q2_4_8
患有慢性病-胃部疾病或消化系统疾病
字符串
分类
Q2_4_9
患有慢性病-肾脏疾病
字符串
分类
Q2_4_10
患有慢性病-肝脏疾病
字符串
分类
Q2_4_11
患有慢性病-情感及精神方面问题
字符串
分类
Q2_4_12
患有慢性病-关节炎或风湿病
字符串
分类
Q2_4_13
患有慢性病-记忆相关的疾病
字符串
分类
Q2_4_14
患有慢性病-哮喘
字符串
分类
Q2_5_1
慢性病诊断-有症状后检查
数字
分类
Q2_5_2
慢性病诊断-常规体检
数字
分类
Q2_5_3
慢性病诊断-自我诊断
数字
分类
Q2_5_4
慢性病诊断-其他方式,
数字
分类
Q2_6_1
治疗方式-服用中药
字符串
分类
Q2_6_2
治疗方式-服用西药
字符串
分类
Q2_6_3
治疗方式-食疗,即食物疗法
字符串
分类
Q2_6_4
治疗方式-打针、输液
字符串
分类
Q2_6_5
治疗方式-中医保健(针灸、按摩等)
字符串
分类
Q2_6_6
治疗方式-运动
字符串
分类
Q2_6_7
治疗方式-宗教方式
字符串
分类
Q2_6_8
治疗方式-其他
字符串
分类
Q2_6_9
治疗方式-没有治疗
字符串
分类
表4:健康意识数据
模块
变量名称
变量含义
变量格式
变量类型
健康意识
Q3_1_1
量表-每个人都可能出现抑郁和焦虑情绪
数字
分类
Q3_1_2
量表-我已掌握基本的情绪管理、压力管理等自我心理调适方法
数字
分类
Q3_1_3
量表-如果出现心理问题,且自我调适不能缓解时,我会寻求心理咨询与心理治疗等专业帮助
数字
分类
Q3_1_4
量表-我会主动学习健康知识
数字
分类
Q3_1_5
量表-我已掌握基本的急救知识和技能
数字
分类
Q3_1_6
量表-我应该注意自己的膳食结构,多吃蔬菜、水果和薯类,注意荤素、粗粮细粮搭配
数字
分类
Q3_1_7
量表-我每日应进行适量的身体活动
数字
分类
Q3_1_8
量表-此题为测试题,请选择“比较同意”
数字
分类
Q3_1_9
量表-遇到健康问题时,我会及时到医疗机构就诊,早诊断、早治疗
数字
分类
Q3_1_10
量表-如果患病我会医嘱治疗,不轻信偏方
数字
分类
Q3_1_11
量表-保健食品可用于预防或治疗疾病
数字
分类
Q3_1_12
量表-我很尊重医学和医务人员
数字
分类
Q3_1_13
量表-医疗技术具有局限性
数字
分类
表5:健康行为数据
模块
变量名称
变量含义
变量格式
变量类型
健康行为
Q4_1
是否有吸烟史
数字
分类
Q4_2
平均一天吸烟数量
数字
连续
Q4_3
在过去一年喝酒的频率
数字
有序
Q4_4_1
在过去一年是否喝过-高度白酒(41度以上)或伏特加、威士忌
字符串
分类
Q4_4_2
在过去一年是否喝过-低度白酒或伏特加、威士忌
字符串
分类
Q4_4_3
在过去一年是否喝过-葡萄酒、米酒或黄酒
字符串
分类
Q4_4_4
在过去一年是否喝过-啤酒
字符串
分类
Q4_4_1文本
在过去一年饮酒量最多的一次喝了多少毫升酒- 高度白酒(41度以上)或伏特加、威士忌
数字
连续
Q4_4_2文本
在过去一年饮酒量最多的一次喝了多少毫升酒-低度白酒或伏特加、威士忌
数字
连续
Q4_4_3文本
在过去一年饮酒量最多的一次喝了多少毫升酒-葡萄酒、米酒或黄酒
数字
连续
Q4_4_4文本
在过去一年饮酒量最多的一次喝了多少毫升酒-啤酒
数字
连续
Q4_5
去医院或医疗机构进行常规体检的频率
数字
有序
Q4_6
是否参加过癌症筛查
数字
分类
Q4_7_1
最近一年内是否有定期自我监测以下情况-血压
字符串
分类
Q4_7_2
最近一年内是否有定期自我监测以下情况-血脂
字符串
分类
Q4_7_3
最近一年内是否有定期自我监测以下情况-血糖
字符串
分类
Q4_7_4
最近一年内是否有定期自我监测以下情况-心率
字符串
分类
Q4_7_5
最近一年内是否有定期自我监测以下情况-肺功能
字符串
分类
Q4_7_6
最近一年内是否有定期自我监测以下情况-其他,
字符串
分类
Q4_7_7
最近一年内是否有定期自我监测以下情况-没有定期监测各种健康项目
字符串
分类
Q4_8
日常的膳食结构中荤素搭配的情况
数字
分类
Q4_9
个人的感受认为每天摄入的蔬菜水果量是否充足
数字
分类
Q4_10_1
最近一年内经常参加以下运动或体力活动-激烈活动
字符串
分类
Q4_10_2
最近一年内经常参加以下运动或体力活动-中等强度活动
字符串
分类
Q4_10_3
最近一年内经常参加以下运动或体力活动-轻度活动
字符串
分类
Q4_10_4
最近一年内经常参加以下运动或体力活动-没有经常参加任何活动
字符串
分类
Q4_11
参加激烈活动的大致频率是
数字
有序
Q4_12
每次参加激烈活动的平均时长是多少分钟
数字
连续
Q4_13
参加中等强度活动的大致频率是
数字
有序
Q4_14
每次参加中等强度活动的平均时长是多少分钟
数字
连续
Q4_15
参加轻度活动的大致频率是
数字
有序
Q4_16
每次参加轻度活动的平均时长是多少
数字
连续
Q4_17
最近一年内,个人感受认为您每天的体育锻炼时间是否充足
数字
有序
Q4_18
过去一个月内平均每天的睡眠时间
数字
连续
Q4_19
过去一个月内,个人感受认为您每天的睡眠时间是否充足
数字
连续
表6:就医行为数据
模块
变量名称
变量含义
变量格式
变量类型
就医行为
Q4_21_1
选择去医院就诊的情况-身体刚出现不适时
字符串
分类
Q4_21_2
选择去医院就诊的情况-身体不适持续一段时间
字符串
分类
Q4_21_3
选择去医院就诊的情况-自我治疗仍无效果后
字符串
分类
Q4_21_4
选择去医院就诊的情况-疾病明显影响到正常工作和生活时
字符串
分类
Q4_21_5
选择去医院就诊的情况-重病不起
字符串
分类
Q4_21_6
选择去医院就诊的情况-其他(请说明)
字符串
分类
Q4_21_7
选择去医院就诊的情况-任何情况都不去医院
字符串
分类
Q4_22
您去医院就诊是否方便
数字
有序
Q4_23_1
就诊不方便的原因-距离太远
字符串
分类
Q4_23_2
就诊不方便的原因-挂号太难
字符串
分类
Q4_23_3
就诊不方便的原因-无人陪伴
字符串
分类
Q4_23_4
就诊不方便的原因-排队等候时间长
字符串
分类
Q4_23_5
就诊不方便的原因-就医环节多或流程复杂
字符串
分类
Q4_23_6
就诊不方便的原因-医院信息化系统或设备操作不方便
字符串
分类
Q4_23_7
就诊不方便的原因-医院的公共设施,如无障碍通道、标识、座椅等不方便
字符串
分类
网址:中国人民大学健康大数据研究院 https://www.yuejiaxmz.com/news/view/912351
相关内容
AI与营养大数据研究中心中国人的健康大数据(文字版)
人大国发院发布《中国家庭能源消费研究报告(2016)》
中国人的六组健康大数据,看的人触目惊心!
北京大学研究生院
中国旅游研究院:2021年国内旅游预约数据报告
健康大数据汇总
2020年中国居民健康大数据分析!
人民数据研究院发布《二手交易与低碳生活研究报告》
[中国睡眠研究会]:2024中国居民睡眠健康白皮书