盘点使用Pandas解决问题:对比两列数据取最大值的5个方法

科技   科技   2024-10-12 09:02   广东  
点击上方“Python爬虫与数据挖掘”,进行关注

回复“书籍”即可获赠Python从入门到进阶共10本电子书

近寒食雨草萋萋,著麦苗风柳映堤。

大家好,我是Python进阶者。

一、前言

前几天在Python星耀交流群有个叫【iLost】的粉丝问了一个关于使用pandas解决两列数据对比的问题,这里拿出来给大家分享下,一起学习。

大概意思是说在DF中有2列数据,想每行取两列数据中的最大值,形成一个新列,该怎么写?最开始【iLost】自己使用了循环的方法写出了代码,当然是可行的,但是写的就比较难受了。

二、解决过程

这里给出5个方法,感谢大佬们的解答,一起来看看吧!

方法一:【月神】解答

其实这个题目的逻辑和思路也相对简单,但是对于Pandas不熟悉的小伙伴,接受起来就有点难了。

df['max1'] = df[['cell1''cell2']].max(axis=1)
df
方法二:【广深-运营-n】解答

这个方法是才哥群里【广深-运营-n】大佬给的方法。

代码如下,亲测可行。

df['max2'] = df.loc[:,['cell1','cell2']].max(axis=1)
df
方法三:【月神】解答

apply方法是最开始想到的方法,但是不知道怎么写,还好有【月神】,这里使用apply方法来解决,代码如下

df['max3'] = df[['cell1''cell2']].apply(max, axis=1)
df
方法四:【常州-销售-MT】解答

这个方法也是才哥群里的一个大佬给的思路。

亲测可行,代码如下:

df = df.assign(new=df[['cell1''cell2']].max(1))

这里的用法需要注意下,不然容易翻车:

细节拉满:

方法五:【上海-数分-长城】解答

这个方法也是才哥群里的一个大佬给的思路。

使用numpy结合pandas,代码如下:

df['max4'] = np.where(df['cell1'] > df['cell2'],df['cell1'], df['cell2'])
df

真是太秀了。

三、总结

大家好,我是Python进阶者。这篇文章基于粉丝提问,针对df中,想在每行取两列数据中的最大值,作为新的一列问题,给出了具体说明和演示,一共5个方法,顺利地帮助粉丝解决了问题,也帮助大家玩转Pandas,学习Python相关知识。

最后感谢粉丝【iLost】提问,感谢【月神】、【dcpeng】、【北京-算法-浩浩】、【上海-数分-长城】、【广深-运营-n】、【常州-销售-MT】大佬们给出的示例和代码支持,感谢【冯诚】、【凌云剑圣】、【PI】、【艾希·觉罗】、【猎影】等人参与学习交流。

小伙伴们,快快用实践一下吧!如果在学习过程中,有遇到任何问题,欢迎加我好友,我拉你进Python学习交流群共同探讨学习。

------------------- End -------------------

往期精彩文章推荐:

欢迎大家点赞,留言,转发,转载,感谢大家的相伴与支持

想加入Python学习群请在后台回复【入群

万水千山总是情,点个【在看】行不行

/今日留言主题/

随便说一两句吧~

Python爬虫与数据挖掘
人生苦短,我用Python。该公众号专注于分享Python网络爬虫、数据挖掘、数据分析、数据处理、数据可视化、自动化测试、运维、大数据、人工智能、云计算、机器学习等工具资源、热点资讯、相关技术文章、学习视频和学习资料等,期待您的加入~~~
 最新文章