一篇文章带你搞定JavaScript 性能调优

大家好,我是皮皮。

JavaScript 是单线程运行的,所以在在执行效率上并不是很高,随着用户体验的日益重视,前端性能对用户体验的影响备受关注,但由于性能问题相对复杂,接下来我们来了解下JavaScript如何提高性能;

从加载上优化:合理放置脚本位置

由于 JavaScript 的阻塞特性,在每一个<script>出现的时候,无论是内嵌还是外链的方式,它都会让页面等待脚本的加载解析和执行,

并且<script>标签可以放在页面的<head>或者<body>中,因此,如果我们页面中的 css 和 js 的引用顺序或者位置不一样,即使是同样

的代码,加载体验都是不一样的。示例如下:

<!DOCTYPE html>
<html>
  <head>
    <meta charset="utf-8">
    <meta name="viewport" content="width=device-width,initial-scale=1.0">
    <title>js 引用的位置性能优化</title>
    <script type="text/javascript" src="index-1.js"></script>
    <script type="text/javascript" src="index-2.js"></script>
    <link rel="stylesheet" href="style.css">
  </head>
  <body>
    <div id="app"></div>
  </body>
</html>

以上代码是一个简单的 html 界面,其中加载了两个 js 脚本文件和一个 css 样式文件,由于 js 的阻塞问题,当加载到 index-1.js 的时候,

其后面的内容将会被挂起等待,直到index-1.js 加载、执行完毕,才会执行第二个脚本文件 index-2.js,这个时候页面又将被挂起等待脚

本的加载和执行完成,一次类推,这样用户打开该界面的时候,界面内容会明显被延迟,我们就会看到一个空白的页面闪过,这种体验是

明显不好的,因此 我们应该尽量的让内容和样式先展示出来,将 js 文件放在 最后,以此来优化用户体验。如下所示:

<!DOCTYPE html>
<html>

  <head>
   <meta charset="utf-8">
    <meta name="viewport" content="width=device-width,initial-scale=1.0">
    <title>js 引用的位置性能优化</title>
    <link rel="stylesheet" href="style.css">
  </head>
  <body>
   <div id="app"></div>
   <script type="text/javascript" src="index-1.js"></script>
   <script type="text/javascript" src="index-2.js"></script>
  </body>
</html>

这段代码展示了在 HTML 文档中放置<script>标签的推荐位置。尽管脚本下载会阻塞另一个脚本,但是页面的大部分内容都已经下载完

成并显示给了用户,因此页面下载不会显得太慢。这是雅虎特别性能小组提出的优化 JavaScript 的首要规则:将脚本放在底部。

从请求次数上优化:减少请求次数

由于每个<script>标签初始下载时都会阻塞页面渲染,所以减少页面包含的<script>标签数量有助于改善这一情况。这不仅针对外链脚本,内嵌脚本的数量同样也要限制。浏览器在解析 HTML 页面的过程中每遇到一个<script>标签,都会因执行脚本而导致一定的延时,因此最小化延迟时间将会明显改善页面的总体性能。

这个问题在处理外链 JavaScript 文件时略有不同。考虑到 HTTP 请求会带来额外的性能开销,因此下载单个 100Kb 的文件将比下载 5 个 20Kb 的文件更快。也就是说,减少页面中外链脚本的数量将会改善性能。

通常一个大型网站或应用需要依赖数个 JavaScript 文件。您可以把多个文件合并成一个,这样只需要引用一个<script>标签,就可以减少性能消耗。文件合并的工作可通过离线的打包工具或者一些实时的在线服务来实现。

需要特别提醒的是,把一段内嵌脚本放在引用外链样式表的之后会导致页面阻塞去等待样式表的下载。这样做是为了确保内嵌脚本在执行时能获得最精确的样式信息。因此,建议不要把内嵌脚本紧跟在标签后面。

有一点我们需要知道:页面加载的过程中,最耗时间的不是 js 本身的加载和执行,相比之下,每一次去后端获取资源,客户端与后台建立链接才是最耗时的,也就是大名鼎鼎的Http 三次握手,当然,http 请求不是我们这一次讨论的主题,因此,减少 HTTP 请求,是我们着重优化的一项,事实上,在页面中 js 脚本文件加载很很多情况下,它的优化效果是很显著的。

从加载方式上优化:无阻塞脚本加载

在 JavaScript 性能优化上,减少脚本文件大小并限制 HTTP 请求的次数仅仅是让界面响应 迅速的第一步,现在的 web 应用功能丰富,js 脚本越来越多,光靠精简源码大小和减少 次数不总是可行的,即使是一次 HTTP 请求,但文件过于庞大,界面也会被锁死很长一段 时间,这明显不好的,因此,无阻塞加载技术应运而生。简单来说, 就是 页面在加载完成后才加载 s js 代码,也就是在 w window 对象的 d load 事件触 发后才去下载脚本。要实现这种方式,常用以下几种方式:

延迟脚本加载( defer )

HTML4 为<script>标签定义了一个扩展属性:defer。Defer 属性指明本元素所含的脚本不会修改 DOM,因此代码能安全地延迟执行。defer 属性只被 IE 4 和 Firefox 3.5 更高版本的浏览器所支持,所以它不是一个理想的跨浏览器解决方案。在其他浏览器中,defer 属性会被直接忽略,因此<script>标签会以默认的方式处理,也就是说会造成阻塞。然而,如果您的目标浏览器支持的话,这仍然是个有用的解决方案。

<script type="text/javascript" src="index-1.js" defer></script>

带有 defer 属性的<script>标签可以放置在文档的任何位置。对应的 JavaScript 文件将在页面解析到<script>标签时开始下载,但不会执行,直到 DOM 加载完成,即 onload事件触发前才会被执行。当一个带有 defer 属性的 JavaScript 文件下载时,它不会阻塞浏览的其他进程,因此这类文件可以与其他资源文件一起并行下载。·任何带有 defer 属性的<script>元素在 DOM 完成加载之前都不会被执行,无论内嵌或者是外链脚本都是如此。

延迟脚本加载( async )

HTML5 规范中也引入了 async 属性,用于异步加载脚本,其大致作用和 defer 是一样的,都是采用的并行下载,下载过程中不会有阻塞,但 不同点在于他们的执行时机,c async 需要加载完成后就会自动执行代码 ,但是 r defer 需要等待页面加载完成后才会执行。

从加载方式上优化:动态添加脚本元素

把代码以动态的方式添加的好处是:无论这段脚本是在何时启动下载,它的下载和执行过程都不会阻塞页面的其他进程,我们甚至可以直接添加带头部 head 标签中,都不会影响其他部分。因此,作为开发的你肯定见到过诸如此类的代码块:

var script = document.createElement('script');
script.type = 'text/javascript';
script.src = 'file.js';
document.getElementsByTagName('head')[0].appendChild(script);

这种方式便是动态创建脚本的方式,也就是我们现在所说的动态脚本创建。通过这种方式下载文件后,代码就会自动执行。但是在现代浏览器中,这段脚本会等待所有动态节点加载完成后再执行。这种情况下,为了确保当前代码中包含的别的代码的接口或者方法能够被成功调用,就必须在别的代码加载前完成这段代码的准备。解决的具体操作思路是:现代浏览器会在 script 标签内容下载完成后接收一个load 事件,我们就可以在 load 事件后再去执行我们想要执行的代码加载和运行,在 IE 中,它会接收 loaded 和 complete事件,理论上是 loaded 完成后才会有 completed,但实践告诉我们他两似乎并没有个先后,甚至有时候只会拿到其中的一个事件,我们可以单独的封装一个专门的函数来体现这个功能的实践性,因此一个统一的写法是:

function LoadScript(url, callback) {
  var script = document.createElement('script');
  script.type = 'text/javascript';
  // IE 浏览器下
  if (script.readyState) {
    script.onreadystatechange = function () {
      if (script.readyState == 'loaded' || script.readyState ==
        'complete') {
        // 确保执行两次
        script.onreadystatechange = null;
        // todo 执行要执行的代码
        callback()
      }
    }
  } else {
    script.onload = function () {
      callback();
    }
  }
  script.src = 'file.js';
  document.getElementsByTagName('head')[0].appendChild(script);
}

LoadScript 函数接收两个参数,分别是要加载的脚本路径和加载成功后需要执行的回调函数,LoadScript 函数本身具有特征检测功能,根据检测结果(IE 和其他浏览器),来决定脚本处理过程中监听哪一个事件。实际上这里的 LoadScript()函数,就是我们所说的 LazyLoad.js(懒加载)的原型。

从加载方式上优化:XMLHttpRequest 脚本注入

通过 XMLHttpRequest 对象来获取脚本并注入到页面也是实现无阻塞加载的另一种方式,这个我觉得不难理解,这其实和动态添加脚本的方式是一样的思想,来看具体代码:

var xhr = new XMLHttpRequest();
xhr.open('get', 'file-1.js', true);
xhr.onreadystatechange = function () {
  if (xhr.readyState === 4) {
    if (xhr.status >= 200 && xhr.status < 300 || xhr.status === 304) {
      // 如果从后台或者缓存中拿到数据,则添加到 script 中并加载执行。
      var script = document.createElement('script');
      script.type = 'text/javascript';
      script.text = xhr.responseText;
      // 将创建的 script 添加到文档页面
      document.body.appendChild(script);
    }
  }
}

通过这种方式拿到的数据有两个优点:其一,我们可以控制脚本是否要立即执行,因为我们知道新创建的 script 标签只要添加到文档界面中它就会立即执行,因此,在添加到文档界面之前,也就是在 appendChild()之前,我们可以根据自己实际的业务逻辑去实现需求,到想要让它执行的时候,再 appendChild()即可。其二:它的兼容性很好,所有主流浏览器都支持,它不需要想动态添加脚本的方式那样,我们自己去写特性检测代码;但由于是使用了 XHR 对象,所以不足之处是获取这种资源有“域”的限制。资源 必须在同一个域下才可以,不可以跨域操作。

总结

减少 JavaScript 对性能的影响有以下几种方法:

 • 将所有的<script>标签放到页面底部,也就是</body>闭合标签之前,这能确保在 脚本执行前页面已经完成了渲染。
 • 尽可能地合并脚本。页面中的<script>标签越少,加载也就越快,响应也越迅速。无论是外链脚本还是内嵌脚本都是如此。
 • 采用无阻塞下载 JavaScript 脚本的方法:
  • 使用<script>标签的 defer 属性(仅适用于 IE 和 Firefox 3.5 以上版 本);
  • 使用动态创建的<script>元素来下载并执行代码;
  • 使用 XHR 对象下载 JavaScript 代码并注入页面中。

通过以上策略,可以在很大程度上提高那些需要使用大量 JavaScript 的 Web 网站和应用的实际性能。

小伙伴们,快快用实践一下吧!如果在学习过程中,有遇到任何问题,欢迎加我好友,我拉你进Python学习交流群共同探讨学习。

实战篇:盘点Pandas中的factorize()函数妙用

大家好,我是皮皮。

一、前言

前几天在Python白银交流群有个叫【蛋蛋】的粉丝问了一个Pandas处理的问题,这里拿出来给大家分享下,一起学习下。

一开始我都没理解她的意思,以为只是简单的替换而已,之前【月神】给了一个代码,当时也写文章记录了,代码如下:

df['col2'] = df['col1'].map({1:"开心", 2:"悲伤", 3:"难过", 4:"泪目"})
df

不过很不巧,这个不是她想要的结果,她想要的结果是同样的几个都是1,然后其余的就是2,3,4,我还是没反应过来,不过【月神】一下子就get到她的意思了,真是太神了。

二、解决过程

这里【月神】给出了解答,使用pd.factorize(data[‘a’])[0]完美地解决了这个问题。

这个类似于onehot编码,对类型进行了数字编码,如果想要把nan也编码,加一个参数na_sentinel=None。

这样一来,就完美地解决了问题。

关于pd.factorize()函数的定义如下:

pandas.factorize(values, sort=False, order=None, na_sentinel=-1, size_hint=None) Encode input values as an enumerated type or categorical variable

简单来说,它可以实现将字符串特征转化为数字特征。

三、总结

大家好,我是皮皮。这篇文章主要分享了Pandas中数据处理的问题,主要讲解了pd.factorize()函数的应用,它可以实现将字符串特征转化为数字特征,针对该问题给出了具体的解析和代码演示,帮助粉丝顺利解决了问题。

最后感谢粉丝【蛋蛋】提问,感谢【月神】和【皮皮】给出的具体解析和代码演示,感谢【dcpeng】、【冫马讠成】等人参与学习交流。

小伙伴们,快快用实践一下吧!如果在学习过程中,有遇到任何问题,欢迎加我好友,我拉你进Python学习交流群共同探讨学习。

Python中的and和or,结果让人出乎意料之外

大家好,我是皮皮。

一、前言

前几天在Python最强王者交流群有个叫【Chloe】的粉丝问了一个Python基础的问题,关于and和or,这里拿出来给大家分享下,一起学习下。

二、解决过程

这里【杰】给出了解答,其实Python中,除括号外,and优先级较高,那么这里的话【瑜亮老师】也给出了解答,确实没有括号,表达式从左往右运算,and比or优先级高,先算and,再算or。

首先计算and对应的输出是False,之后再和or一起计算,得到输出是True。

别走,这个题目【瑜亮老师】还有拓展,还有新知识呢!

and 和 or 还有个很有意思的用法:
print(1 and '字符串')
# 输出:字符串
# 原理:x and y 的值只可能是x或y。x为真就是y, x为假就是x
print(0 or '字符串')
# 输出:字符串
# 原理:x or y 的值只可能是x或y。x为真就是x, x为假就是y

三、总结

大家好,我是皮皮。这篇文章主要分享了Python基础中的and和or的优先级问题,针对该问题给出了具体的解析和代码演示,帮助粉丝顺利解决了问题,还额外做了一些知识拓展,学到很多东西。

最后感谢粉丝【Chloe】提问,感谢【月神】、【杰】、【瑜亮老师】给出的具体解析和代码演示,感谢【瑜亮老师】额外分享更多的Python知识,感谢【dcpeng】、【PI】、【冫马讠成】等人参与学习交流。

小伙伴们,快快用实践一下吧!如果在学习过程中,有遇到任何问题,欢迎加我好友,我拉你进Python学习交流群共同探讨学习。

编写一个闭包函数,要实现的功能是计数功能

大家好,我是皮皮。

一、前言

前几天在Python最强王者交流群有个叫【杰】的粉丝问了一个Python装饰器的问题,这里拿出来给大家分享下,一起学习下。

二、解决过程

这里【东哥】给出了解答,其实这个题目就是在考你装饰器的内容。

代码如下:

count = 0
def wrapper(func):
  def inner(*args, **kwargs):
    global count
    count += 1
    result = func(*args, **kwargs)
    return result
  return inner


# while True:
#   @wrapper
#   def calc(count):
#     print(count)
#
#   calc(count)
for i in range(10):
  @wrapper
  def calc(count):
    print(count)

  calc(count)

注释的那块是死循环,不过代码稍微有点冗余。

这里更新了下,如下:

count = 0
def wrapper(func):
  def inner(*args, **kwargs):
    global count
    count += 1
    result = func(*args, **kwargs)
    return result
  return inner


@wrapper
def calc():
  print(count)


calc()

因为调用了一次,下面再加一个calc(),这样效果就出来了。

三、总结

大家好,我是皮皮。这篇文章主要分享了Python的装饰器问题,针对该问题给出了具体的解析和代码演示,帮助粉丝顺利解决了问题。

最后感谢粉丝【杰】提问,感谢【月神】、【东哥】给出的具体解析和代码演示,感谢【dcpeng】等人参与学习交流。

小伙伴们,快快用实践一下吧!如果在学习过程中,有遇到任何问题,欢迎加我好友,我拉你进Python学习交流群共同探讨学习。

盘点一道Python中的yield生成器的题目

大家好,我是皮皮。

一、前言

前几天在Python最强王者交流群有个叫【Chloe】的粉丝问了一个Python生成器的问题,这里拿出来给大家分享下,一起学习下。

盘点一道Python中的yield生成器的题目

二、解决过程

这里【月神】给出了解答,如下图所示:

盘点一道Python中的yield生成器的题目

当然了,这块有点难理解的部分,如下图所示:

盘点一道Python中的yield生成器的题目

如果加return的话,效果就不一样了。

盘点一道Python中的yield生成器的题目

这里在额外细节化一下,【瑜亮老师】给出了yield用法细节。

盘点一道Python中的yield生成器的题目

盘点一道Python中的yield生成器的题目

这个题目主要就考察yield返回结果时,“暂停”函数,再次调用后继续执行yield后面的代码。

这里给出一份代码,理解起来更加容易一些:

def even_odd(x):
  for j in x:
    if j % 2 == 0:
      yield 'Even' + str(j)
    yield 'Odd' + str(j)


num = [0, 1, 2, 3, 4, 5]
for i in even_odd(num):
  print(i, end=" ")

这个输出的结果是:Even0 Odd0 Odd1 Even2 Odd2 Odd3 Even4 Odd4 Odd5

盘点一道Python中的yield生成器的题目

最后,总结下生成器的用法和特点,

盘点一道Python中的yield生成器的题目

盘点一道Python中的yield生成器的题目

三、总结

大家好,我是皮皮。这篇文章主要分享了Python生成器的用法问题,针对该问题给出了具体的解析和代码演示,帮助粉丝顺利解决了问题,还额外做了一些知识拓展,学到很多东西。

最后感谢粉丝【Chloe】提问,感谢【月神】、【瑜亮老师】给出的具体解析和代码演示,感谢【dcpeng】、【PI】、【老松鼠】、【冫马讠成】等人参与学习交流。

小伙伴们,快快用实践一下吧!如果在学习过程中,有遇到任何问题,欢迎加我好友,我拉你进Python学习交流群共同探讨学习。

Python网络爬虫中重新请求,请问有什么比较好的解决方法?

大家好,我是皮皮。

一、前言

前几天在Python钻石群有个叫【某嘟】的粉丝问了一个关于Python网络爬虫中重新请求的问题,这里拿出来给大家分享下,一起学习。

Python网络爬虫中重新请求,请问有什么比较好的解决方法?

二、解决过程

这里【D I Y】大佬给了一个思路,确实可行。

Python网络爬虫中重新请求,请问有什么比较好的解决方法?

不过后来她自己又找到了一个更好的方法,找到一个HTTPAdapter可以实现超时重试,大概用法如下:

from requests.adapters import HTTPAdapter
req = requests.Session()
req.mount(‘https://’, HTTPAdapter(max_retries=3))
response = req.get(“https://weibo.com/ajax/statuses/hot_band”, timeout=10)
最后判断数据 len(hot_dict.get(“content”)) == 50
大概是可以的。

Python网络爬虫中重新请求,请问有什么比较好的解决方法?

当时看到这里,也想起来前几天【瑜亮老师】分享的那个题目,关于Python网络爬虫请求的时候,大文件的抓取判断。之前也写过文章分享,这里就不再赘述了,感兴趣的小伙伴,可以前往:

Python网络爬虫中重新请求,请问有什么比较好的解决方法?

三、总结

大家好,我是皮皮。这篇文章基于粉丝提问,针对Python网络爬虫中重新请求的问题,给出了具体说明和演示,文章提出了两个解决思路,顺利地帮助粉丝解决了问题!

最后感谢粉丝【某嘟】提问,感谢【某嘟】、【D I Y】大佬给出的代码和思路支持,感谢粉丝【PI】、【德善堂小儿推拿-瑜亮老师】等人积极参与学习交流。

小伙伴们,快快用实践一下吧!如果在学习过程中,有遇到任何问题,欢迎加我好友,我拉你进Python学习交流群共同探讨学习。

Python列表中的深浅拷贝,你学废了嘛?

大家好,我是皮皮。

一、前言

前几天在Python最强王者交流群有个叫【Chloe】的粉丝问了一个Python深浅拷贝的问题,这里拿出来给大家分享下,一起学习下。

二、解决过程

深浅拷贝这个东东在列表中挺烦人的,傻傻分不清楚,不过不慌,明白了之后,就不难了。

那么再看上面那道题目,【Chloe】先copy了才改变了list1的值,所以lst2的第二个元素还是20。

至于其他的,就比较好懂一些了,看下图的解析,很清晰。

修改原对象内层对象会对浅拷贝造成影响,而修改原对象外层对象则不会对浅拷贝产生影响。

这里有一个地方需要注意,细节的东西,不然就会把自己绕进去了。

三、总结

大家好,我是皮皮。这篇文章主要分享了Python列表中的深浅拷贝的问题,给出了具体的解析和代码演示,帮助粉丝顺利解决了问题。

最后感谢粉丝【Chloe】提问,感谢【杰】给出的具体解析和代码演示,感谢【dcpeng】等人参与学习交流。

小伙伴们,快快用实践一下吧!如果在学习过程中,有遇到任何问题,欢迎加我好友,我拉你进Python学习交流群共同探讨学习。

只用3行Python代码,获取星期几?

大家好,我是皮皮。

一、前言

前几天在Python最强王者交流群分享了一个只用3行Python代码,获取星期几的问题,这里拿出来给大家分享下,一起学习下。

看到这个代码,我当时的第一反应是,这个人基础学的还是可以的,input用到位了。对于初学者来说,能写成这样,也是不错的了,起码功能确实是实现了,虽然说起来确实有点说不上来的味道,应缺斯汀。

二、解决过程

有一说一,针对这个星期几的问题,群里的小伙伴们也给出了几个方法,一起来看看吧。

【冯诚】解答

这里给出【冯诚】大佬的写法,如下图所示:

【月神】解答

下面这个代码是【月神】提供的,如下所示:

from datetime import datetime

print(f"星期{list('一二三四五六日')[datetime.today().weekday()]}")

【瑜亮老师】解答

下面这个代码是【瑜亮老师】提供的,如下所示:

week_dict = {1: '星期一', 2: '星期二', 3: '星期三', 4: '星期四', 5: '星期五', 6: '星期六', 7: '星期日'}
k = int(input("请输入星期数字(1-7):"))   # 此处省略 try 检测 int 转换
print(week_dict.get(k, "输入错误"))

使用字典的get方法,设置了默认值,用于提示输入的数字不在1-7范围。

如果把字典里面的key都改成字符串型的,连int都省了。代码如下:

week_dict = {'1': '星期一', '2': '星期二', '3': '星期三', '4': '星期四', '5': '星期五', '6': '星期六', '7': '星期日'}
k = input("请输入星期数字(1-7):") 
print(week_dict.get(k, "输入错误"))

完美配合!

三、总结

大家好,我是皮皮。这篇文章主要分享了只用3行Python代码,获取星期几的问题,文章中给出了具体的解析和代码演示,帮助粉丝顺利解决了问题。

最后感谢【瑜亮老师】、【月神】、【冯诚】给出的具体解析和代码演示,感谢【Jun】、【磐奚鸟】、【黑脸怪】、【皮皮】、【dcpeng】等人参与学习交流。

小伙伴们,快快用实践一下吧!如果在学习过程中,有遇到任何问题,欢迎加我好友,我拉你进Python学习交流群共同探讨学习。

按照A列进行分组并计算出B列每个分组的平均值,然后对B列内的每个元素减去分组平均值

大家好,我是皮皮。

一、前言

前几天在Python星耀交流群有个叫【在下不才】的粉丝问了一个Pandas的问题,按照A列进行分组并计算出B列每个分组的平均值,然后对B列内的每个元素减去分组平均值,这里拿出来给大家分享下,一起学习。

二、解决过程

这个看上去倒是不太难,但是实现的时候,总是一看就会,一用就废。这里给出【瑜亮老师】的三个解法,一起来看看吧!

方法一:使用自定义函数

代码如下:

import pandas as pd

lv = [1, 2, 2, 3, 3, 4, 2, 3, 3, 3, 3]
num = [122, 111, 222, 444, 555, 555, 333, 666, 666, 777, 888]
df = pd.DataFrame({'lv': lv, 'num': num})

def demean(arr):
  return arr - arr.mean()
# 按照"lv"列进行分组并计算出"num"列每个分组的平均值,然后"num"列内的每个元素减去分组平均值
df["juncha"] = df.groupby("lv")["num"].transform(demean)
print(df

# transform 也支持 lambda 函数,效果是一样的,更简洁一些
# df["juncha"] = df.groupby("lv")["num"].transform(lambda x: x - x.mean())
# print(df)

方法二:使用内置函数

代码如下:

import pandas as pd

lv = [1, 2, 2, 3, 3, 4, 2, 3, 3, 3, 3]
num = [122, 111, 222, 444, 555, 555, 333, 666, 666, 777, 888]
df = pd.DataFrame({'lv': lv, 'num': num})


gp_mean = df.groupby('lv')["num"].mean().rename("gp_mean").reset_index()
df2 = df.merge(gp_mean)
df2["juncha"] = df2["num"] - df2["gp_mean"]
print(df2)

方法三:使用 transform

transform能返回完整数据,输出的形状和输入一致(输入是num列,输出也是一列),代码如下:

import pandas as pd

lv = [1, 2, 2, 3, 3, 4, 2, 3, 3, 3, 3]
num = [122, 111, 222, 444, 555, 555, 333, 666, 666, 777, 888]
df = pd.DataFrame({'lv': lv, 'num': num})


# 方法三: 使用 transform。
df["gp_mean"] = df.groupby('lv')["num"].transform('mean')
df["juncha"] = df["num"] - df["gp_mean"]
print(df)
# 直接输出结果,省略分组平均值列
df["juncha"] = df["num"] - df.groupby('lv')["num"].transform('mean')
print(df)

这样问题就完美地解决啦!

后面他还想用类的方式写,不过看上去没有那么简单。

三、总结

大家好,我是皮皮。这篇文章主要分享了Pandas处理相关知识,基于粉丝提出的按照A列进行分组并计算出B列每个分组的平均值,然后对B列内的每个元素减去分组平均值的问题,给出了3个行之有效的方法,帮助粉丝顺利解决了问题。

最后感谢粉丝【在下不才】提问,感谢【德善堂小儿推拿-瑜亮老师】给出的具体解析和代码演示,感谢【月神】提供的思路,感谢【dcpeng】等人参与学习交流。

小伙伴们,快快用实践一下吧!如果在学习过程中,有遇到任何问题,欢迎加我好友,我拉你进Python学习交流群共同探讨学习。

Python面向对象中的类变量,实例变量怎么来理解?

大家好,我是皮皮。

一、前言

前几天在Python最强王者交流群有个叫【Chloe】的粉丝问了一个类变量和实例变量的问题,这里拿出来给大家分享下,一起学习下。

二、解决过程

在Python Tutorial中对于类变量和实例变量是这样描述的:

Generally speaking, instance variables are for data unique to each instance and class variables are for attributes and methods shared by all instances of the class.

通常来说,实例变量是对于每个实例都独有的数据,而类变量是该类所有实例共享的属性和方法。

针对下方的代码:

class Calculate:
  A = 20
  B = 20
  def __init__(self,a,b):
    A = a
    B = b
    print(self.A+self.B/2+1)

Calculate(4,10)

这个代码输出的结果是31.0,因为self是指向类本身,所以在init外定义A,B可以用self.A,self.B调用,但在init内设置的A,B只是局部变量。

有了以上的基础打底之后,接下来给这个代码做几个变形,就更加清晰了。

class Calculate:
  A = 20
  B = 20
  def __init__(self,a,b):
    self.A = a
    self.B = b
    print(self.A+self.B/2+1)

Calculate(4,10)

像上方的这个代码输出的结果就是10.0。

下面给出【dcpeng】大佬给出的几个图解:

这么看应该清晰了

再次变形:

最后再给大家分享下self这个参数,参考下图:

三、总结

大家好,我是皮皮。这篇文章主要分享了Python面向对象中的类变量,实例变量的问题,给出了具体的解析和代码演示,帮助粉丝顺利解决了问题。

最后感谢粉丝【Chloe】提问,感谢【孤独】、【dcpeng】、【月神】给出的具体解析和代码演示,感谢【艾希·觉罗】等人参与学习交流。