系统级性能分析工具--Systemtap

el/2024/7/17 21:53:19

  SystemTap 是一款诊断Linux系统性能的工具,可以跟踪内核以及用户态程序中的任意函数、syscall、语句甚至指令,可以用来动态地收集调试和性能信息的工具,不需要我们重新编译、重启内核。缺点:用户需要自己编辑脚本测试文件。

假如现在有这么一个需求:需要获取正在运行的 Linux 系统的信息,如我想知道系统什么时候发生系统调用,发生的是什么系统调用等这些信息,有什么解决方案呢?

  • 最原始的方法是,找到内核系统调用的代码,加上我们需要获得信息的代码、重新编译内核、安装、选择我们新编译的内核重启。这种做法对于内核开发人员简直是梦魇,因为一遍做下来至少得需要1个多小时,不仅破坏了原有内核代码,而且如果换了一个需求又得重新做一遍上面的工作。所以,这种调试内核的方法效率是极其底下的。
  • 之后内核引入了一种Kprobe机制,可以用来动态地收集调试和性能信息的工具,是一种非破坏性的工具,用户可以用它跟踪运行中内核任何函数或执行的指令等。相比之前的做法已经有了质的提高了,但Kprobe并没有提供一种易用的框架,用户需要自己去写模块,然后安装,对用户的要求还是蛮高的。
  • systemtap 是利用Kprobe 提供的API来实现动态地监控和跟踪运行中的Linux内核的工具,相比Kprobe,systemtap更加简单,提供给用户简单的命令行接口,以及编写内核指令的脚本语言。对于开发人员,systemtap是一款难得的工具。

systemtap 的安装

 

安装内核调试所需要的包

yum -y install kernel-devel-2.6.32-642.3.1.el6.x86_64

yum -y install kernel-debuginfo-2.6.32-642.3.1.el6.x86_64

yum -y install kernel-debuginfo-common-x86_64-2.6.32-642.3.1.el6.x86_64

 

安装SystemTap并配置脚本

yum -y install systemtap

 

 

systemtap 测试示例

安装完systemtap之后,我们需要测试一下systemtap是否能正确运行:

示例一:打印hello systemtap

以root用户或者具有sudo权限的用户运行以下命令:

$stap -ve 'probe begin { log("hello systemtap!") exit() }'

如果安装正确,会得到如下类似的输出结果:

Pass 1: parsed user script and 96 library script(s) using 55100virt/26224res/2076shr/25172data kb, in 120usr/0sys/119real ms.
Pass 2: analyzed script: 1 probe(s), 2 function(s), 0 embed(s), 0 global(s) using 55496virt/27016res/2172shr/25568data kb, in 0usr/0sys/4real ms.
Pass 3: translated to C into "/tmp/stapYqNuF9/stap_e2d1c1c9962c809ee9477018c642b661_939_src.c" using 55624virt/27380res/2488shr/25696data kb, in 0usr/0sys/0real ms.
Pass 4: compiled C into "stap_e2d1c1c9962c809ee9477018c642b661_939.ko" in 1230usr/160sys/1600real ms.
Pass 5: starting run.
hello systemtap!
Pass 5: run completed in 0usr/10sys/332real ms.

示例二:输出4s内所有open系统调用的信息

创建systemtap脚本文件test2.stp:

#!/usr/bin/stapprobe begin 
{log("begin to probe")
}probe syscall.open
{printf ("%s(%d) open (%s)\n", execname(), pid(), argstr)
}probe timer.ms(4000) # after 4 seconds
{exit ()
}probe end
{log("end to probe")
}

将该脚本添加可执行的权限 chmod +x test2.stp ,使用./test2.stp 运行该脚本,即可输出4s内所有open系统调用的信息,打印格式为:进程名(进程号)打开什么文件。 大家可以自行去测试,如果两个示例都能正确运行,基本上算是安装成功了!

 

systemtap 工作原理

 

systemtap 的核心思想是定义一个事件(event),以及给出处理该事件的句柄(Handler)。当一个特定的事件发生时,内核运行该处理句柄,就像快速调用一个子函数一样,处理完之后恢复到内核原始状态。这里有两个概念:

  • 事件(Event):systemtap 定义了很多种事件,例如进入或退出某个内核函数、定时器时间到、整个systemtap会话启动或退出等等。
  • 句柄(Handler):就是一些脚本语句,描述了当事件发生时要完成的工作,通常是从事件的上下文提取数据,将它们存入内部变量中,或者打印出来。

Systemtap 工作原理是通过将脚本语句翻译成C语句,编译成内核模块。模块加载之后,将所有探测的事件以钩子的方式挂到内核上,当任何处理器上的某个事件发生时,相应钩子上句柄就会被执行。最后,当systemtap会话结束之后,钩子从内核上取下,移除模块。整个过程用一个命令 stap 就可以完成。 上面只是简单的原理,更多背后的机理参考网上资料和相应的论文。 图 systemtap 处理流程

 

systemtap官网: https://sourceware.org/systemtap/documentation.html

 

 


http://www.ngui.cc/el/5557051.html

相关文章

Mac安装pillow模块

pip install --use-wheel Pillow

NumPy、Pandas、Matplotlib、 scipy机器学习库安装

NumPy系统是Python的一种开源的数值计算扩展。这种工具可用来存储和处理大型矩阵,比Python自身的嵌套列表(nested list structure)结构要高效的多(该结构也可以用来表示矩阵(matrix))。据说NumPy将Python相…

Mac下TensorFlow的部署和安装

$ sudo easy_install pip $ sudo easy_install --upgrade six $ sudo pip install --upgrade https://storage.googleapis.com/tensorflow/mac/tensorflow-0.8.0rc0-py2-none-any.whl 安装完成后,即可运行测试用例 $ python ... >>> import tensor…

Java编译后产生class文件的命名规则

今天刚好有同学问了下Java编译后产生的.class文件名的问题,虽然一直都在使用Java做开发,但是之前对编译后产生的.class文件名的规范也基本没做了解过,也真的是忏愧啊!今天无论如何都要总结下。下面是本人今天做的实验 1、创建类Cl…

centos6.9 安装tensorflow心得体会

综述:centos安装tensorflow太坑了,如何你是个使用linux的新手,建议你不要尝试了,可以换ubuntu或者mac系统进行安装配置tensorflow。 难点一: importError: /lib64/libc.so.6: version GLIBC_2.14 not found import …

ubuntu错误 let: not found解决办法

错误描述:运行shell脚本,报错误 test.sh: 4: test.sh: let: not found 解决办法: Its because Ubuntu uses the dash shell as default and doesnt always recognize when you try to set the shell in a script. Even if you enter "…

Python两个内置函数——locals 、globals 和命名空间说明

Python两个内置函数—— locals 和 globals 这两个函数主要提供,基于字典的访问局部和全局变量的方式。 在理解这两个函数时,首先来理解一下python中的名字空间概念。 Python使用叫做名字空间的 东西来记录变量的轨迹 。名字空间只是一个字典&#xff0c…

Ubuntu16.04 安装bazel

一、首先,安装jdk8 这里省略jdk8的安装过程 二、在包资源中增加Bazel的发布源 echo "deb [archamd64] http://storage.googleapis.com/bazel-apt stable jdk1.8" | sudo tee /etc/apt/sources.list.d/bazel.list curl https://bazel.build/bazel-releas…

Numpy基础笔记(1)

Numpy简介 Numpy(Numerical Python的简称)是高性能科学计算和数据分析的基础包。其部分功能如下: ①ndarray,一个具有矢量算术运算和复杂广播能力的快速且节省空间的 多维数组 。 ②用于对整组数据进行快速运算的标准数学函数…

Numpy基础笔记---Array 和matrix(2)

一、关于Numpy Numpy是Python第一个矩阵类型,提供了大量矩阵处理的函数。非正式地来说,它是一个使运算更easy,执行速度更快的库,因为它的内部运算是通过C语言实现的。 numpy包含了两种基本的数据类型:矩阵和数组。在使…