数据分析必备知识(1)，Numpy基础篇_ _ 頭條網

python科学计算包 numpy是pandas、SciPy、sklearn等模块的必需模块，pandas、SciPy和sklearn模块都是在numpy模块的基础上封装的，由此可见numpy的作用是很大的。

numpy在后期数据科学方面的学习上会经常性用到的，特别是算法模型这一大块，要将数据转换成不同维度的数组以便符合算法模型的需求。

本文是总结性文章，适合学过、还没学过的读者朋友阅读。下面从numpy基础操作讲起，后续将持续更新.....

安装：

pip install numpy

导入模块

import numpy as np

1、创建数组

# 一维数组 np.array([1, 2, 3, 4])

array([1, 2, 3, 4])

# 二维数组，指定数据类型为浮点型 np.array([(1.5, 2, 3), (4, 5, 6)], dtype=float)

array([[ 1.5, 2. , 3. ],

[ 4. , 5. , 6. ]])

# 三维数组 np.array([[(1.5, 2, 3), (4, 5, 6), (3, 2, 1), (4, 5, 6)]], dtype = float)

array([[[ 1.5, 2. , 3. ],

[ 4. , 5. , 6. ],

[ 3. , 2. , 1. ],

[ 4. , 5. , 6. ]]])

2、初始化占位符

# 1、创建值为 0 的数组, np.zeros((rows, columns)) np.zeros((3, 4))

array([[ 0., 0., 0., 0.],

[ 0., 0., 0., 0.],

[ 0., 0., 0., 0.]])

# 2、创建值为 1 数组 # np.ones((多少个数组，rows，columns)) np.ones((2, 3, 4), dtype=np.int16)

array([[[1, 1, 1, 1],

[1, 1, 1, 1],

[1, 1, 1, 1]],

[[1, 1, 1, 1],

[1, 1, 1, 1],

[1, 1, 1, 1]]], dtype=int16)

# 3、创建均匀间隔的数组（步进值，类似于等差数列） # np.arange(start, end, 等差值) np.arange(10, 25, 2)

array([10, 12, 14, 16, 18, 20, 22, 24])

# 4、创建均匀间隔的数组（样本值） # np.linspace(允许的最小值，允许的最大值，生成样本值的个数) np.linspace(0, 2, 9)

array([ 0. , 0.25, 0.5 , 0.75, 1. , 1.25, 1.5 , 1.75, 2. ])

# 5、创建常数数组 # np.full((rows, columns), 指定的常数值) np.full((3, 6), 5)

array([[5, 5, 5, 5, 5, 5],

[5, 5, 5, 5, 5, 5],

[5, 5, 5, 5, 5, 5]])

# 6、创建 3 x 3 单位矩阵 np.eye(3)

array([[ 1., 0., 0.],

[ 0., 1., 0.],

[ 0., 0., 1.]])

# 7、创建随机值的数组 # np.random.random((rows, columns)) np.random.random((2, 2))

array([[ 0.23610365, 0.55253555],

[ 0.6943377 , 0.05858759]])

3、输入输出

1、输出

# 语法：np.save(fileName, 需要保存的数组) np.save('../data/my_array', [b, a]) # 保存多个要用 () 或者 [] 括起来 np.savez('../data/my_array.npz', a, b) np.savetxt('../data/my_array.txt', b, delimiter=" ") np.savetxt('../data/my_array.csv', b, delimiter=",")

2、输入

np.load('../data/my_array.npy') np.loadtxt('../data/my_array.txt') np.genfromtxt('../data/my_array.csv', delimiter=' ')

4、数据类型

1、带符号的64位整数

np.int64

# 指定创建的"步进值"数组为整数 np.arange(1, 20, 4, dtype=np.int64)

array([ 1, 5, 9, 13, 17], dtype=int64)

2、标准双精度浮点数

np.float32

# 创建均匀的样本值 np.linspace(1, 6, 5, dtype=np.float32)

array([ 1. , 2.25, 3.5 , 4.75, 6. ], dtype=float32)

3、显示为128位浮点数的复数

np.complex

4、布尔值：True值和False值

np.bool

5、Python 对象

# 创建 4 x 4 矩阵，指定类型为 python 对象 np.object np.eye(4, dtype=np.object)

array([[1, 0, 0, 0],

[0, 1, 0, 0],

[0, 0, 1, 0],

[0, 0, 0, 1]], dtype=object)

6、固定长度字符串

# 创建常数数组，指定类型为字符串 np.string_ np.full((3, 4), 4, dtype=np.string_)

array([[b'4', b'4', b'4', b'4'],

[b'4', b'4', b'4', b'4'],

[b'4', b'4', b'4', b'4']],

dtype='|S1')

5、数组信息

test = np.array([[1, 15, 10, 2], [2, 5, 9, 1], [6, 2, 5, 4]]) test

array([[ 1, 15, 10, 2],

[ 2, 5, 9, 1],

[ 6, 2, 5, 4]])

1、数组形状，几行几列

# 查看整体形状，查看行的形状，查看列的形状 a, b, c= test.shape, test.shape[0], test.shape[1] a, b, c

((3, 4), 3, 4)

2、数组长度

len(test) # 也相当求行的数量

3、几维数组

test.ndim

4、数组有多少个元素

test.size

5、数据类型

test.dtype

dtype('int32')

6、数据类型的名字

test.dtype.name

'int32'

7、数据类型转换

test.astype(float)

array([[ 1., 15., 10., 2.],

[ 2., 5., 9., 1.],

[ 6., 2., 5., 4.]])

6、查看某个函数怎么使用，有哪些参数

np.info(np.linspace)

End-----------

推荐往期文章如下：

导入模块

1、创建数组

2、初始化占位符

3、输入输出

4、数据类型

5、数组信息

6、查看某个函数怎么使用，有哪些参数

相關文章:

必备，必背，必会《古诗五百首》长安雅士直播带货

SuiteCRM和Facebook集成（使用Facebook API） – 必备

带你掌握Python中简单的Numpy数值计算

口碑最好的眼霜排行榜：熬夜党“必备”,用后眼纹黑眼圈消失了

一起学数据分析之NumPy(14)——线性代数

最全开学物品清单！聪明的家长都收藏了

想成为签约作家？必备“硬核”技能了解一下

为什么人工智能的首选语言是python？

温文默克的学习笔记Python篇（4）——矩阵转置

温文默克的学习笔记Python篇（3）——表格打印

如果不懂 numpy，请别说自己是 python 程序员

必备！超全消毒指南！建议转到“相亲相爱一家人”群里

Python数组运算包NumPy使用：核心数据对象——ndarray

Python数组运算包NumPy使用：ndarray数组转置

“五一”必备！福建4A以上旅游景区这样预约！

安耐晒防晒霜怎么用 今天我来告诉你！

“复古女郎”必备！今年最火的“格纹裤”，让你的穿搭更光彩夺目

好书推荐｜利用Python进行数据分析（附PDF及源码下载）

面试技巧大全PPT工具包（免费资料）

必备！2019最新细分行业龙头股全概括，建议收藏

10大Python机器学习库

速看！“五一”必备！闽侯旅游景区这样预约

Python Numpy全世界最长基础教程最适合小白比全球的还长 还详细

“五一”必备！福建4A以上景区预约攻略来了！

无所不能的Python能干什么？看看它的一行代码实现功能瞬间明白了

造价工程师清单计算必备，12套工程量计算表格模板赠送，分享收藏

十一假期即将来临，宝宝出行全攻略奉上，收走不谢

深度学习行业薪资明显高于不少行业，是时候学习一门框架找工作了

战“疫”期，阿里云云效团队在家高效开发实录

三套草书必备珍藏字帖(绝版)

独家资源：2020年高考数学最后冲刺压轴试卷高分必备—概率部分

深入扒一扒 NumPy 中文网《防脱发指南》，糟糕被圈粉了

华为会计凭证装订太秀了！

仙女必备! 6 3款春夏高跟鞋合集仙女永远缺一双高跟鞋!!

必备！碎花裙好看，搭配什么鞋子更好看

新房装修必备的实用家电清单，没想到最实用的，都是平价的！

50个又贱又骚气的表情，来呀~一起快活呀~

这三款插画图集也太赞了吧！看完果断收藏了

2020高考必备：高中数学100个高频考点

必备！这份“猎赖”宝典你值得拥有！

如何预判创业可行性？

小白入行软件测试必备技能，史上最全，不容错过

书单来啦 | 五一小长假安抚家中“神兽”必备

「必备」中国文化知识100题，测测你能答对多少？

NumPy入门系列（二）

必备！2020年暑期TOEFL考位紧张，全年托福考试情况！

空调省电小妙招！必备

主持人大赛：男主持3分钟讲解，要想有所作为“必备”的几大要素

NumPy入门系列（一）

#时尚无时限# #美妆爱用# @头条时尚 凡士林真是个好东西！可以说是家庭必备神器了！百搭又便宜今天给大家整理了下凡士林的25种用法大家可以先收藏有空再看看哦

潜逃压力过大暴瘦40多斤，一涉黑A级通缉犯在河北投案自首

当我们在谈 SaaS 的时候，在谈什么？

合同诈骗的类型有哪些？企业无力偿还借款是否构成合同诈骗罪？

5月西安招聘会时间安排来了！找工作的别错过

刚刚工作的毕业生，一个月只有2000多，是不是太少了？

全球闹「美元荒」带动稳定币需求暴增！以太坊交易量创近两年新高

“帮助当地居民解决用水难题”-今日头条-手机光明网

灌篮高手无水印壁纸，每一张都是回忆

通辽蓝天救援队成功解救辽河公园水上被困群众

5月6日·武汉要闻及抗击肺炎快报

肖副省长等省市领导到孝感市楚澴中学调研九年级复学暨疫情防控常态化工作

相声界的颜值担当张云雷称号大揭秘

美国百年薅羊毛攻略

《全职高手》：一口气刷了10集，对杨洋路转粉了

共同承担责任！Rookie谈BP问题：输了是我们打得太臭

LOL"中韩对抗赛"遭选手反对？Zoom直言不想打，Doinb的回答太真实

李亚鹏携李嫣出席慈善晚会，李嫣手上钻戒抢镜，1个动作获夸赞！

53岁郭富城再度升级当爸，方媛怀二胎，Chant要做姐姐了

那些拼命的演员：王宝强喝了一大桶牛奶，孙俪吃10斤瓜子

贾乃亮用上了“一米阳光”这个词，他依然渴望拥有美丽的爱情！

搞笑GIF开心一刻：我的老家农村，有妹子愿意嫁给我吗？

为什么只有edg赚钱？

安耐晒防晒霜怎么用今天我来告诉你！

Python Numpy全世界最长基础教程最适合小白比全球的还长还详细

#时尚无时限# #美妆爱用# @头条时尚凡士林真是个好东西！可以说是家庭必备神器了！百搭又便宜今天给大家整理了下凡士林的25种用法大家可以先收藏有空再看看哦

应急科普丨“五一” 期间气温回升谨防森林火灾隐患