1. 二元分类问题
医学诊断:预测某人是否患有某种疾病(如癌症、心脏病等)。 信用风险评估:预测借款人是否会违约。 客户流失分析:预测客户是否会在特定时期内停止使用某项服务。
2. 多元分类问题
交通方式选择:预测一个人选择步行、骑车、乘坐公共交通或开车。 教育水平:预测一个人的最高学历(高中、本科、硕士、博士等)。
3. 预测概率
市场营销:预测一个潜在客户购买某产品的概率。 选举预测:预测某候选人获得选票的概率。
4. 处理非线性关系
5. 处理混合数据类型
社会调查研究:分析社会经济因素(如收入、年龄、性别)对某种行为(如投票、购物)的影响。
6. 数据中存在多余的零值
家庭出行分析:在车辆行驶里程(VMT)数据中,许多家庭可能没有任何车辆行驶记录,此时可以将VMT数据转换为二元变量(是否产生VMT)。
7. 分析与解释变量的影响
健康研究:分析各种生活方式因素(如运动、饮食)对健康结果(如患病概率)的影响。
2. Logistic Regression的应用领域
3. 城市规划中的逻辑回归:案例研究
因变量:
anyvmt
(二元:1表示家庭产生任何VMT,0表示没有产生)。自变量:
hhsize
(家庭规模)hhworker
(家庭中的工人数)lnhhincome
(家庭收入的自然对数)entropy
(土地使用多样性)pct4way
(四路交叉口的百分比)stopden
(公交车站密度)