来测试下 2019 你一共写了多少行代码？

佚名

2021-03-23 20:57:19

写啊写代码，2019 你都写了多少行代码呢

自己动手实现一个代码统计工具

导入所需的库

这个程序需要用到的库有：os，time
这两个库都是 Python 自带的，所以我们直接 import 就行

<code>

import

time/<code>

现在我们已经导入要使用的库了，可以直接写代码了

定义要读取的文件地址

首先，我们定义一个路径吧，因为要读取文件统计代码行数嘛

<code>

base_dir

'./'

file_lists

= []/<code>base_dir ：假设我们读取的是当前目录下的目录 / 文件file_lists：因为我们读取的文件不止一个，所以使用列表来存储

指定你要读取的文件类型

<code>

file_type

= [

'py'

]/<code>

这里以 Python 文件为例，因为代码是用 Python 写的嘛，所以读取 py 为后缀的文件

遍历目录 / 文件

上面我们定义了路径是 ./ （当前目录下），文件类型是 py 的，接下来我们需要遍历一下当前路径中的文件，代码如下：

<code>

def

getDir_or_File(base_dir):

global

file_lists

for

parent,dirnames,filenames in os.walk(base_dir):

for

filename in filenames:

file

filename.split('.')[-1]

file in file_type:

file_lists.append(os.path.join(parent,filename))

/<code>

代码分析

os.walk(top, topdown=True, οnerrοr=None, followlinks=False)：输出在文件夹中的文件名通过在树中游走，向上或者向下

top ：是你所要遍历的目录的地址, 返回的是一个三元组(root,dirs,files)。root ：所指的是当前正在遍历的这个文件夹的本身的地址dirs ：是一个 list ，内容是该文件夹中所有的目录的名字(不包括子目录)files ：同样是 list , 内容是该文件夹中所有的文件(不包括子目录)topdown ：可选，为 True，则优先遍历 top 目录，否则优先遍历 top 的子目录(默认为开启)。如果 topdown 参数为 True，walk 会遍历top文件夹，与top 文件夹中每一个子目录。onerror ：可选，需要一个 callable 对象，当 walk 需要异常时，会调用。followlinks ：可选，如果为 True，则会遍历目录下的快捷方式(linux 下是软连接 symbolic link )实际所指的目录(默认关闭)，如果为 False，则优先遍历 top 的子目录

这样讲好像不太好理解，我们实践一下，编写以下代码进行测试

<code>import

for

parent, dirnames, filenames

.walk(

"./"

(parent)

(dirnames)

(filenames)/<code>

从图中可知道改代码位于 demo 文件夹下

OK，我们运行一下这个程序

没学过 os 库的朋友可能会有点疑问，为什么 for 循环那里要有三个参数？必须的吗？

<code>

for

parent

dirnames

filenames

.walk

(

"./"

):/<code>

是的，是必须的，不信？我们去掉一个参数运行一下，代码如下：

<code>import

for

parent, filenames

.walk(

"./"

(parent)

(filenames)/<code>

运行，报错了

报错信息为：ValueError: too many values to unpack (expected 2)
说我们太多值无法解包？（一头雾水）
我们来看下官方是怎么解释的

对于根目录在目录树顶部的每个目录（包括顶部本身，但不包括 ’ . ’ 和 '… '），产生一个三元组目录路径，目录名，文件名

这也就说明了 for 循环中的参数是缺一不可的

读取代码行数

上面我们已经实现了遍历目录和文件了，接下来我们需要读取文件了
说到读取文件相信学习过 Python 的朋友都应该知道，无非就是 open 和 with open，没学习过的朋友也没关系，这里简单教你几下

首先我们定义一个函数 def countLines(file_name): ，具体代码如下：

<code>

def

countLines

(file_name)

count =

for

file_line

open(file_name,

'r'

,encoding=

'utf-8'

).readlines():

file_line !=

and

file_line !=

'\n'

: count +=

print(file_name +

'----'

, count)

return

count/<code>

注意： open 那里一定要加上编码格式（encoding=‘utf-8’），否则会报以下错误 UnicodeDecodeError: ‘gbk’ codec can’t decode byte 0x84 in position 48: illegal multibyte sequence

你以为这样就可以了？no，继续上代码：

<code>

__name__ ==

'__main__'

: startTime = time.perf_counter() getDir_or_File(base_dir) totallines = 0

for

filelist

file_lists: totallines = totallines + countLines(filelist)

(

'total lines:'

,totallines)

(

'Success! Cost Time: %0.2f seconds'

% (time.perf_counter() - startTime))/<code>

代码测试

到这里我们的代码已经编写完成，我们测试一下我们的程序，测试之前我们先准备几个 py 文件

我们在 demo 文件夹下创建了一个 code.py 文件和一个 test 目录，而我们的 test 目录下也有一个 test.py 文件，两个文件的内容是一样的，只是一个没有空行，一个有空行，我们来运行一下我们编写的程序，我们将路径指向 demo 目录

<code>

base_dir

'./demo'

/<code>

OK，运行一下程序

从图中我们可以看到程序执行成功了，而且行数也统计出来了，那么统计到底对不对呢？是正确的，我们上面的 code.py 是有空行的，去掉空行就是 13 行，而 test.py 本来就是 13 行且没有空行

全部代码

全部代码如下：

<code>讨论学习群：

887934385

分享python资料

import

time base_dir =

'需要指定的路径'

file_lists = [] file_type = [

'py'

]

def

getDir_or_File

(base_dir)

global

file_lists

for

parent,dirnames,filenames

os.walk(base_dir):

for

filename

filenames: file= filename.split(

'.'

)[

-1

]

file

file_type: file_lists.append(os.path.join(parent,filename))

def

countLines

(file_name)

count =

for

file_line

open(file_name,

'r'

,encoding=

'utf-8'

).readlines():

file_line !=

and

file_line !=

'\n'

: count +=

print(file_name +

'----'

, count)

return

count

__name__ ==

'__main__'

: startTime = time.perf_counter() getDir_or_File(base_dir) totallines =

for

filelist

file_lists: totallines = totallines + countLines(filelist) print(

'total lines:'

,totallines) print(

'Success! Cost Time: %0.2f seconds'

% (time.perf_counter() - startTime))/<code>

打包成可执行程序

其实我们还可以修改一下代码将代码打包成 exe 文件，这样就可以转发给别人使用了，如我们将这个文件命名为 test.py，使用 pyinstaller 打包程序

<code>

pyinstaller

-F

test

.py

-w

/<code>

这个实现很简单，但是也有个缺点，就是需要把程序放到你要统计的路径下才能统计不能指定路径统计，其实也差不多，只要把程序放到你要统计的目录就行了，来测试一下：
打包后的程序如下

放到我的一个 Django 项目下，双击 test.exe

双击运行后会在该目录下创建一个 totalcount 的 txt 文本

我们打开这个文本看下，可以看到文本中显示还读取到了 html 了，是自己设置的哈，并不是代码写错了

一共读取了 19 个文件
376 行代码

用时 0.02s

关于很多朋友问我打包成 exe 运行无法生成 txt 文件，其实还稍作了修改的
我把打包好的 exe 放到了Github了文件下载地址，想要的朋友可以去下载，喜欢的朋友记得给个star，非常感谢
更多的精彩技术文章可关注公众号python社区营，提供源码、视频教程

自己动手实现一个代码统计工具

导入所需的库

定义要读取的文件地址

指定你要读取的文件类型

遍历目录 / 文件

代码分析

读取代码行数

代码测试

全部代码

打包成可执行程序

相關文章:

2019.11.1日指数估值

2019-20赛季五大联赛开赛时间（附免费直播地址）

【MWC 2019】诺基亚 新品Nokia 9 PureView 2 月 24 日正式登场

石必中诗词5

2019.12.4 鸡蛋价早知道，今日鸡蛋价格继续偏强

Myeclipse 2019.12.5重磅出击，六大改变强化Java开发体验

2019.11.03早安祝福丨愿你智慧像源泉、欢笑如阳光。

2019.11.04早安祝福丨幸运的一天，从佛菩萨的祝福开始

2019.12.20 鸡蛋价早知道，今日鸡蛋价格继续下跌

奇瑞瑞虎8 2019：成功更新中国跨界车

2019 Computex：一大波"黑科技"迎面吹来！

2019.2.26—早鸽

vivo APEX 2019，为什么网友对这款手机如此好奇？

2019，等我

2019.11.05晨起祝福丨祝你笑口常开像弥勒，菩萨常伴

2019.12.6日记

1314天，成长. 满足. 拼搏. 坚持. 突破. 我们一路同行！

2019.11.06午评及建议

2019.11.7，小雪

2019.12.3-明天猪价-猪价一路飙升！希望不是虎头蛇尾

2019.12.20 向阳高飞｛6｝

2019.12.19 向阳高飞｛5｝

2019.12.17 向阳高飞｛3｝

2019.12.18 向阳高飞｛4｝

亮相DISPLAY CHINA 2019，维信诺秀出概念车

2019.12.21华强北全新国产 苹果 三星批发报价

ThinkPad X1 Carbon 2019 LTE版：精英之选 更进一步

每日一句经典说说【2019.11.02】

中梁地产3.89亿元摘得广德县2019-5号、2019-6号地块

2019年已经过去了，我会怀念它的

2019.12.26日，拜谒伟人

2019-2020赛季WCBA山西烈焰竹叶青女篮太原站时间地点、比赛赛程

快讯！肥西「2019」1号、肥西「2019」2号地块取消供应

2019.12.16 向阳高飞 ｛2｝

宁强法院举行“三秦飓风•2019”执行专项行动启动仪式

纽约股市三大股指期货5日小幅上涨「2019.12.6交易经验」

2019.1.1日花呗瓜分15亿，你分了多少？

2019.11.27「原创」跟随才是顺势而为核心

2019.12.16-2019.12.23十二星座运势（上）

小麦价格知多少。2019.5.31

2019.12.21——梦话

2019.12.28——坐火车

2019.12.11「原创」致富路上常犯的错误和需要注意的事项有哪些？

2019.12.03「原创」交易中常犯的错误有哪些

2019 Style Baby全国少儿平面超模大赛全国总决赛圆满收官

NIKE超级盛典 八克白BULKBAY点燃“RTD蛋白补充”热潮

WPS Office 2019 一款生产力工具真正应有的模样

为了接近目标对象，吃下这颗让人瞬间变小的APTX4869……[灵光一闪]乘着气球从天而降，此刻的我，是游乐园里最可爱的宝宝！就算看到了手里的屠刀，也不会有哪头小猪舍得逃跑吧[笑]2019.04.11

脱下心爱的作战服，换上精心裁剪的西装，来到繁华绚丽的舞会之中。那位高贵优雅的菠萝莉小姐，不论是你的芳心，还是你的性命，都将在今夜，由我温柔地收下……2019.03.21 18:00【YTG vs BA

#2019KPL春季赛# #王者荣耀# JC VS RNG.M 【比赛时间】 2019.3.7 20:00 【比赛地点】 成都量子光电竞中心 新的征途，再次起航！

潜逃压力过大暴瘦40多斤，一涉黑A级通缉犯在河北投案自首

当我们在谈 SaaS 的时候，在谈什么？

合同诈骗的类型有哪些？企业无力偿还借款是否构成合同诈骗罪？

5月西安招聘会时间安排来了！找工作的别错过

刚刚工作的毕业生，一个月只有2000多，是不是太少了？

全球闹「美元荒」带动稳定币需求暴增！以太坊交易量创近两年新高

“帮助当地居民解决用水难题”-今日头条-手机光明网

灌篮高手无水印壁纸，每一张都是回忆

通辽蓝天救援队成功解救辽河公园水上被困群众

5月6日·武汉要闻及抗击肺炎快报

肖副省长等省市领导到孝感市楚澴中学调研九年级复学暨疫情防控常态化工作

相声界的颜值担当张云雷称号大揭秘

美国百年薅羊毛攻略

《全职高手》：一口气刷了10集，对杨洋路转粉了

共同承担责任！Rookie谈BP问题：输了是我们打得太臭

LOL"中韩对抗赛"遭选手反对？Zoom直言不想打，Doinb的回答太真实

李亚鹏携李嫣出席慈善晚会，李嫣手上钻戒抢镜，1个动作获夸赞！

53岁郭富城再度升级当爸，方媛怀二胎，Chant要做姐姐了

那些拼命的演员：王宝强喝了一大桶牛奶，孙俪吃10斤瓜子

【MWC 2019】诺基亚新品Nokia 9 PureView 2 月 24 日正式登场

2019.12.21华强北全新国产苹果三星批发报价

ThinkPad X1 Carbon 2019 LTE版：精英之选更进一步

2019.12.16 向阳高飞｛2｝

NIKE超级盛典八克白BULKBAY点燃“RTD蛋白补充”热潮

#2019KPL春季赛# #王者荣耀# JC VS RNG.M 【比赛时间】 2019.3.7 20:00 【比赛地点】成都量子光电竞中心新的征途，再次起航！

应急科普丨“五一” 期间气温回升谨防森林火灾隐患