癌症诊断

  • 有一些微观数据,都是人体细胞内的数据
  • 中医:望闻问切
  • 西医:各种设备,检查一通
  • 无论中医还是西医:
    • 获取指标
    • 获取数据
    • 获取特征
  • 看病,通过,指标诊断
  • 设备越来越先进,获取更多微观数据、指标
  • 有一些病,先微观,变成宏观(感觉不舒服)
  • 量变到质变
  • 可以尝试找到围观数据和疾病之间的关系!
  • 使用算法寻找数据内部的规律
  • KNN调整超参数,准确率提升
  • 数据归一化、标准化,提升更加明显!

薪资预测

  • 属性清理,将没有属性删除
  • 一些属性是str类型的
  • pandas中map、agg、apply、transform这些都可以转变!
  • 建模
    • knn
    • knn.fit()
    • knn.predict()预测
    • knn.score()准确率,分类
  • 模型优秀,模型准确率更高
    • 超参数调整
    • 归一化、标准化
    • pandas.cut(),分箱操作,面元化操作,其实就是分类
    • 把相近的数值,归到一类中
    • 大学时候,体育成绩:优(90~100)、良(80~90)、中等(70~80)、及格(60~70)、不及格(<60)
    • 大学成绩,就是分箱操作。
    • 简明扼要。