你会用PowerQuery统计字符串中各类字符出现的次数吗?

你会用PowerQuery统计字符串中各类字符出现的次数吗?这时就必须借助于自定义函数,比如下面这个:=>let源= Text.PositionOfAny,转换为表 = Table.FromList

大家好,欢迎来到IT知识分享网。

很多时候我们需要统计单个字符或某种字符出现的次数,那么在PowerQuery中怎么实现呢?

你会用PowerQuery统计字符串中各类字符出现的次数吗?

01统计字符串中单一字符出现的次数

有小伙伴提了一个问题:“PowerQuery是否有直接统计字符串中指定字符个数的函数”,我翻了下PowerQuery参考,并没有找到这样的一个函数。

那有没有法子用PowerQuery来实现统计字符串中特定字符的出现个数呢?我目前知道的有两种方法(假设要统计字符串【1-2-3-9】中【-】出现的次数):

= List.Count(Text.PositionOf(“1-2-3-9″,”-“,Occurrence.All))

= Text.Length(“1-2-3-9”)-Text.Length(Text.Replace(“1-2-3-9″,”-“,””))

两种方法殊途同归,不过我觉得方法一更“优雅”一些。

那还会不会有第三种方法呢?

更进一步,我们可以在这个例子的基础上进行延伸和拓展。

02统计字符串中出现的数字个数

统计字符串【1-2-3-9】中【数字】出现的次数:

= List.Count(Text.PositionOfAny(“1-2-3-9”,{“0”..”9″},Occurrence.All))

但是如果要统计字符串【李四5676中华234大家庭】中数字出现的次数,则结果就不对:

= List.Count(Text.PositionOfAny(“李四5676中华234大家庭”,{“0”..”9″},Occurrence.All))

上面统计的结果是7,但是我们想要的结果是2。原因在于上面的代码是把【5676】这一个数字作为四个数字统计了四次,实际上我们需要的是把【5676】作为一个整体统计一次。

那要如何才能得到正确结果呢?这时就必须借助于自定义函数,比如下面这个:

(str as text)=>let

源 = Text.PositionOfAny(str,{“0”..”9″},Occurrence.All),

转换为表 = Table.FromList(源, Splitter.SplitByNothing(), null, null, ExtraValues.Error),

已添加索引 = Table.AddIndexColumn(转换为表, “索引”, 0, 1),

已添加自定义 = Table.AddColumn(已添加索引, “自定义”, each

try

if 已添加索引[Column1]{[索引]}+1=已添加索引[Column1]{[索引]+1}

then “drop”

else “keep”

otherwise “end”),

筛选的行 = Table.SelectRows(已添加自定义, each ([自定义] <> “drop”)),

自定义1 = Table.RowCount(筛选的行)

in

自定义1

在字符串上调用这个自定义函数就能统计出正确的数字结果。比如字符串【李四5676中华234大家庭】中的数字是2。

所以,只有统计单个数字出现的次数,才能用List.Count()结合Text.PositionOfAny()函数的方法。

如果要统计多个单数字构成的数值的出现次数,则必须用自定义函数曲线实现。

03统计字符串中汉字出现的个数

统计字符串【李四5676中华大家庭】中【汉字】出现的次数:

= List.Count(Text.PositionOfAny(“李四5676中华大家庭”,{“一”..”龥”},Occurrence.All))

免责声明:本站所有文章内容,图片,视频等均是来源于用户投稿和互联网及文摘转载整编而成,不代表本站观点,不承担相关法律责任。其著作权各归其原作者或其出版社所有。如发现本站有涉嫌抄袭侵权/违法违规的内容,侵犯到您的权益,请在线联系站长,一经查实,本站将立刻删除。 本文来自网络,若有侵权,请联系删除,如若转载,请注明出处:https://yundeesoft.com/84012.html

(0)

相关推荐

发表回复

您的电子邮箱地址不会被公开。 必填项已用 * 标注

关注微信