python字符串处理技巧

科技   2024-10-19 11:34   广东  
 今天是生信星球陪你的第1012天

   
公众号里的文章大多数需要编程基础,如果因为代码看不懂,而跟不上正文的节奏,可以来找我学习,相当于给自己一个新手保护期。我的课程都是循环开课,点进去咨询微信↓
生信分析直播课程(每月初开一期,春节休一个月)
生信新手保护学习小组(每月两期)
单细胞陪伴学习小组(每月两期)

今天来学习几个字符串处理的技巧。

字符串,或者说字符型数据,可以是你的数据里的基因名、细胞样本名、临床信息、分组等等,但凡他们需要调整和探索,都需要用到字符串处理的函数和方法。

xs = ["The birch canoe slid on the smooth planks." ,
      "Glue the sheet to the dark blue background.",
      "It's easy to tell the depth of a well."  ] 
x = xs[0]
x
'The birch canoe slid on the smooth planks.'

1.长度

len(xs)
3
len(x)
42

如果提供的参数是列表或者是字典,就返回列表或列表的长度(元素个数)。如果提供的参数是字符串,就返回字符个数。

2.字符串拆分

x.split(" ")
['The', 'birch', 'canoe', 'slid', 'on', 'the', 'smooth', 'planks.']

3.按照位置提取字符串

x[4:9]
'birch'

4.检测关键词

'ch' in x
True
x.startswith("T")
True
x.endswith(".")
True

5.字符串替换和删除

x.replace("o","A",1#只替换一个
'The birch canAe slid on the smooth planks.'
x.replace("o","A")
'The birch canAe slid An the smAAth planks.'
x.replace("o","")
'The birch cane slid n the smth planks.'

字符串的所有属性都不支持列表,如果需要批量操作,就要用到列表推导式或者循环

[len(x) for x in xs]
[42, 43, 38]
[x.split(" "for x in xs]
[['The', 'birch', 'canoe', 'slid', 'on', 'the', 'smooth', 'planks.'],
['Glue', 'the', 'sheet', 'to', 'the', 'dark', 'blue', 'background.'],
["It's", 'easy', 'to', 'tell', 'the', 'depth', 'of', 'a', 'well.']]



生信星球
一个零基础学生信的平台-- 原创结构化图文/教程,精选阶段性资料,带你少走弯路早入门,收获成就感,早成生信小能手~
 最新文章