Python中筛选DataFrame中字符长度大于40的,剔除小于40的

wulabaha 发布于 2018/11/16 16:25
阅读 1K+
收藏 0

 如下代码报错,有没有其他方法???


b 

0    数学是利用符号语言研究数量、结构、变化以及空间等概念的一门学科,从某种角度看属于形式科学的一...
1    哲学(英语:philosophy)是对普遍的和基本的问题的研究,这些问题通常和存在、知识、价...
2    文学是指以语言文字为工具形象化地反映艺术,包括戏剧、诗歌、小说、散文等,是文化的重要表现形式...
3    历史(现代汉语词汇,古典文言文称之为史),指人类社会过去的事件和行动,以及对这些事件行为有系...
4    计算机科学(,有时缩写为)是系统性研究信息与计
Name: Explanation, dtype: object

df = []
for index,item in b.iterrows():
    
    #print(index)
    m=b.Explanation[index]
    if len(m)>40:
        df.append(m)


AttributeError: 'Series' object has no attribute 'iterrows'

 

加载中
0
小激动Caim
小激动Caim

假设要筛选的DataFrame是df,包含一个名为column_name的列,可以使用如下代码筛选出字符长度大于40的行:

df = df[df['column_name'].str.len() > 40]

此代码将使用str.len()方法获取column_name列中每个字符串的长度,然后返回长度大于40的行。可以将筛选后的结果重新分配给df,以便剔除长度小于40的行。 如果要剔除长度小于40的行,只需要将筛选条件改为小于等于40,如下所示:

df = df[df['column_name'].str.len() > 40]

此代码将使用str.len()方法获取column_name列中每个字符串的长度,然后返回长度大于40的行。可以将筛选后的结果重新分配给df,以便剔除长度小于等于40的行。

OSCHINA
登录后可查看更多优质内容
返回顶部
顶部