你会用PowerQuery统计字符串中各类字符出现的次数吗?

很多时候我们需要统计单个字符或某种字符出现的次数,那么在PowerQuery中怎么实现呢?

你会用PowerQuery统计字符串中各类字符出现的次数吗?

01统计字符串中单一字符出现的次数

有小伙伴提了一个问题:“PowerQuery是否有直接统计字符串中指定字符个数的函数”,我翻了下PowerQuery参考,并没有找到这样的一个函数。

那有没有法子用PowerQuery来实现统计字符串中特定字符的出现个数呢?我目前知道的有两种方法(假设要统计字符串【1-2-3-9】中【-】出现的次数):

= List.Count(Text.PositionOf("1-2-3-9","-",Occurrence.All))


= Text.Length("1-2-3-9")-Text.Length(Text.Replace("1-2-3-9","-",""))


两种方法殊途同归,不过我觉得方法一更“优雅”一些。

那还会不会有第三种方法呢?

更进一步,我们可以在这个例子的基础上进行延伸和拓展。


02统计字符串中出现的数字个数

统计字符串【1-2-3-9】中【数字】出现的次数:

= List.Count(Text.PositionOfAny("1-2-3-9",{"0".."9"},Occurrence.All))

但是如果要统计字符串【李四5676中华234大家庭】中数字出现的次数,则结果就不对:

= List.Count(Text.PositionOfAny("李四5676中华234大家庭",{"0".."9"},Occurrence.All))

上面统计的结果是7,但是我们想要的结果是2。原因在于上面的代码是把【5676】这一个数字作为四个数字统计了四次,实际上我们需要的是把【5676】作为一个整体统计一次。

那要如何才能得到正确结果呢?这时就必须借助于自定义函数,比如下面这个:


(str as text)=>let

源 = Text.PositionOfAny(str,{"0".."9"},Occurrence.All),

转换为表 = Table.FromList(源, Splitter.SplitByNothing(), null, null, ExtraValues.Error),

已添加索引 = Table.AddIndexColumn(转换为表, "索引", 0, 1),

已添加自定义 = Table.AddColumn(已添加索引, "自定义", each

try

if 已添加索引[Column1]{[索引]}+1=已添加索引[Column1]{[索引]+1}

then "drop"

else "keep"

otherwise "end"),

筛选的行 = Table.SelectRows(已添加自定义, each ([自定义] <> "drop")),

自定义1 = Table.RowCount(筛选的行)

in

自定义1

在字符串上调用这个自定义函数就能统计出正确的数字结果。比如字符串【李四5676中华234大家庭】中的数字是2。

所以,只有统计单个数字出现的次数,才能用List.Count()结合Text.PositionOfAny()函数的方法。

如果要统计多个单数字构成的数值的出现次数,则必须用自定义函数曲线实现。

03统计字符串中汉字出现的个数

统计字符串【李四5676中华大家庭】中【汉字】出现的次数:

= List.Count(Text.PositionOfAny("李四5676中华大家庭",{"一".."龥"},Occurrence.All))


分享到:


相關文章: