python字符串处理技巧

科技 2024-10-19 11:34 广东

今天是生信星球陪你的第1012天

公众号里的文章大多数需要编程基础，如果因为代码看不懂，而跟不上正文的节奏，可以来找我学习，相当于给自己一个新手保护期。我的课程都是循环开课，点进去咨询微信↓
生信分析直播课程(每月初开一期，春节休一个月)
生信新手保护学习小组（每月两期）
单细胞陪伴学习小组（每月两期)

今天来学习几个字符串处理的技巧。

字符串，或者说字符型数据，可以是你的数据里的基因名、细胞样本名、临床信息、分组等等，但凡他们需要调整和探索，都需要用到字符串处理的函数和方法。

xs = ["The birch canoe slid on the smooth planks." ,
      "Glue the sheet to the dark blue background.",
      "It's easy to tell the depth of a well."  ]

x = xs[0]
x

'The birch canoe slid on the smooth planks.'

1.长度

len(xs)

len(x)

如果提供的参数是列表或者是字典，就返回列表或列表的长度（元素个数）。如果提供的参数是字符串，就返回字符个数。

2.字符串拆分

x.split(" ")

['The', 'birch', 'canoe', 'slid', 'on', 'the', 'smooth', 'planks.']

3.按照位置提取字符串

x[4:9]

'birch'

4.检测关键词

'ch' in x

True

x.startswith("T")

True

x.endswith(".")

True

5.字符串替换和删除

x.replace("o","A",1) #只替换一个

'The birch canAe slid on the smooth planks.'

x.replace("o","A")

'The birch canAe slid An the smAAth planks.'

x.replace("o","")

'The birch cane slid n the smth planks.'

字符串的所有属性都不支持列表，如果需要批量操作，就要用到列表推导式或者循环

[len(x) for x in xs]

[42, 43, 38]

[x.split(" ") for x in xs]

[['The', 'birch', 'canoe', 'slid', 'on', 'the', 'smooth', 'planks.'],
 ['Glue', 'the', 'sheet', 'to', 'the', 'dark', 'blue', 'background.'],
 ["It's", 'easy', 'to', 'tell', 'the', 'depth', 'of', 'a', 'well.']]

http://mp.weixin.qq.com/s?__biz=MzU4NjU4ODQ2MQ==&mid=2247496378&idx=1&sn=6a7002a6cf720744a6b2e3f30499cee6

生信星球

一个零基础学生信的平台-- 原创结构化图文/教程，精选阶段性资料，带你少走弯路早入门，收获成就感，早成生信小能手~

最新文章

多样本数据的自动注释-harmony和celltypist

审美不够，配色来凑，数量不够，拿啥来凑?

从体育生到医学生，一路逆袭，一路自我救赎

单细胞陪伴学习小组召唤你

招聘|中山大学-广州医科大学联合招聘神经生物学与生物信息学方向博士后

漂亮的单细胞多组火山图

拟时序分析的State表达矩阵和差异基因

如果你的mac装包很困难，那就试试...

生信入门&数据挖掘线上直播课11月班

igraph更新，让monocle出bug啦

不看KM-plot，不做cox回归，怎么量化哪个组的预后好

近期的生信培训日程

数据存储格式小知识：tar、gz、tar.gz、mtx、tsv、csv大揭秘！

python字符串处理技巧

jupyter 的魔法函数

python单细胞数据的基因集打分

python单细胞自动注释工具celltypist(排版不抽风版)

python单细胞自动注释工具celltypist

富集的物种不是人咋整啊

你这KEGG富集到了吗？

python 单细胞scanpy流程

抓出电脑上的大文件

评估多个模型[系列完结]

建模数据的预处理

模型的超参数优化

分类模型的评测指标

正则化回归

理解什么叫交叉验证

半职妈妈的朝朝暮暮

线性回归的基础知识

线性回归模型简介

生信入门&数据挖掘线上直播课10月班

机器学习分类模型的性能衡量

机器学习分类模型的构建和预测

使用scikit-learn进行机器学习

多重假设检验P值的校正及Python实现

R用户要整点python[系列完结]

R用户要整点python--matplotlab画图

R用户要整点python--seaborn画图

R用户要整点python--pandas画图

R用户要整点python--pandas进阶

R用户要整点python--数据框里的数据类型

生信入门&数据挖掘线上直播课9月班

R用户要整点python--pandas数据框取子集

周末南京见

R用户要整点python--pandas数据框取子集

R用户要整点python--推导式

R用户要整点python--函数

R用户要整点python--条件和循环

分类

时事

民生

政务

教育

文化

科技

财富

体娱

健康

情感

旅行

百科

职场

楼市

企业

乐活

学术

汽车

时尚

创业

美食

幽默

美体

文摘

原创标签

时事社会财经军事教育体育科技汽车科学房产搞笑综艺明星音乐动漫游戏时尚健康旅游美食生活摄影宠物职场育儿情感小说曲艺文化历史三农文学娱乐电影视频图片新闻宗教电视剧纪录片广告创意壁纸头像心灵鸡汤星座命理教育培训艺术文化金融财经健康医疗美妆时尚餐饮美食母婴育儿社会新闻工业农业时事政治星座占卜幽默笑话独立短篇连载作品文化历史科技互联网

发布位置

广东北京山东江苏河南浙江山西福建河北上海四川陕西湖南安徽湖北内蒙古江西云南广西甘肃辽宁黑龙江贵州新疆重庆吉林天津海南青海宁夏西藏香港澳门台湾美国加拿大澳大利亚日本新加坡英国西班牙新西兰韩国泰国法国德国意大利缅甸菲律宾马来西亚越南荷兰柬埔寨俄罗斯巴西智利卢森堡芬兰瑞典比利时瑞士土耳其斐济挪威朝鲜尼日利亚阿根廷匈牙利爱尔兰印度老挝葡萄牙乌克兰印度尼西亚哈萨克斯坦塔吉克斯坦希腊南非蒙古奥地利肯尼亚加纳丹麦津巴布韦埃及坦桑尼亚捷克阿联酋安哥拉