大学生心理健康调查与可视化之数据获取分析

发布于:2025-02-14 ⋅ 阅读:(484) ⋅ 点赞:(0)

以下是获取大学生心理健康开源数据集的主要途径及推荐资源:


一、综合数据平台

  1. Kaggle

  2. UCI Machine Learning Repository


二、学术研究共享平台

  1. Zenodo

  2. OpenNeuro


三、政府与教育机构

  1. WHO Global Health Observatory

  2. 中国国家心理健康服务平台


四、高校研究项目

  1. 哈佛大学 Dataverse

  2. 北京大学开放研究数据平台


五、数据采集工具

  1. PsyToolKit

  2. LimeSurvey

    • 开源问卷系统,支持导出结构化数据:
      # 示例:从LimeSurvey API获取数据
      import requests
      response = requests.get(
          "https://yourdomain.org/limesurvey/api",
          params={"survey_id":123, "token":"YOUR_KEY"}
      )
      

六、注意事项

  • 伦理合规:使用数据前需确认是否符合《赫尔辛基宣言》及当地隐私法规。
  • 数据清洗:开源数据常存在缺失值,建议使用Pandas处理:
    df = df.dropna(subset=['depression_score'])
    df['anxiety_level'] = df['anxiety_score'].apply(
        lambda x: 'high' if x>14 else 'medium' if x>7 else 'low'
    )
    
  • 数据增强:对小样本数据集可结合SMOTE算法生成合成数据:
    from imblearn.over_sampling import SMOTE
    X_resampled, y_resampled = SMOTE().fit_resample(X, y)
    

如果需要特定国家/地区的数据,可尝试通过当地教育部门信息公开申请获取(如美国通过FOIA请求)。建议优先选择使用标准化心理评估工具(如PHQ-9、GAD-7、SCL-90)的数据集,以确保研究效度。


网站公告

今日签到

点亮在社区的每一天
去签到