C程序性能优化:20个实验与达人技巧.pdf

C程序性能优化:20个实验与达人技巧.pdf
 

书籍描述

编辑推荐
《C程序性能优化:20个实验与达人技巧》作者片山善夫精通高效编程,其开发的C编译器,不仅适用于16位及32位系统,还能在GPU中对视频数据进行实时编译。作者将C高效编程的心得浓缩于20个技巧,并将这些技巧通过实验的方式进行讲解,简明易懂,使人印象深刻。书中带有大量的代码实例,使读者不仅能够从理论上得以提高,而且还能够轻松地在实践中应用。

作者简介
作者:(日本)片山善夫 译者:何本华 居福国

片山善夫,具有近二十年的C语言编译器和解释器开发经验。现从事对SPARC、VisionChip等体系结构的研究。
何本华,日语专业翻译,擅长IT类、工程技术类、新闻稿件类翻译,曾担任奥特曼之父中田幸和的口译。
居福国,毕业于复旦大学计算机科学与技术专业,精通C语言和Java,具有丰富的编程经验。

目录
第1章CPU与编译器概论
1.1高速路与人行道
1.2编译器是如何运作的
编译后的汇编语言程序
添加优化选项后的结果
1.3CPU是如何运作的
指令集架构与微架构
如何执行指令
指令流水线
高速缓存
深入探讨高速缓存
缓存块的替换算法
超标量指令执行
第1章是不是偏离了主题
第2章执行成本
2.1两程序的执行成本
书中的探讨
2.3防止基准测试程序被优化
防止操作“归并”
防止变量在初始化时被优化
防止重复单一指令被优化
本书中的基准测试程序
2.4验证——哪一步操作导致执行速度缓慢
2.5基础加法与赋值运算
单一的赋值操作(寄存器间的传送)
单一的赋值操作(数据相互关联的情况)
常量赋值
变量间的加法运算
变量与常量相加
2.6耗时的乘法运算
变量间的乘法运算
变量与常量相乘
2.7更为耗时的除法运算
变量的除法(寄存器间的计算)
除数为2、4的除法运算
除数不是2的乘方的除法运算
无符号整数除法运算
除数为2的乘方时除法运算使用低成本移位指令
2.8内存读取
小数组的读取(小范围内的内存操作)
大数组的读取(大范围内的内存操作)
与台式机的CPU进行比较
2.9造成执行时间差别的判断语句
无else节点的if语句
带else节点的if语句
2.1032/64位环境中不同的函数调用
2.11实验总结
若想被爱则先爱
第3章寻找性能瓶颈
3.1使用gprof命令进行分析
gprof的使用方法
3.2哪个环节在消耗时间
获取库函数的评测信息
耗时的函数
显示库函数的调用次数
3.3函数的调用关系
3.4进行数据分析的原理
3.5其他性能分析器
培养高水平人才的教育系统
第4章达人方法论
4.1达人的关注点
硬件篇
编译器/中间件篇
算法篇
4.2【硬件篇】数组和缓存的有效利用
矩阵的乘法运算
调整数组操作的顺序
展开循环的方式
矩阵的分块
4.3【库函数篇】缓慢函数的迂回战术
strcmp函数为何缓慢
优化的陷阱
4.4【硬件篇】使用SIMD进行字符串对比
4.5【库函数篇】对比各种输入输出方法
行输入函数的对比
输出方法
管道输入输出的特殊案例
管道输入输出与文件输入输出
4.6【算法篇】二分法查找与平衡二叉树
海量数据的分类
真要做到如此地步?
第5章进一步研究编译器
5.1不同级别的优化选项
GCC的优化选项
“零优化”对调试有效
以不出现未定义行为为前提的2级以上优化选项
5.2优化·寄存器·外部变量
5.3删除公共子表达式为程序瘦身
5.4指针与复杂运算简化
5.5将用户函数进行内联展开
和别人拉开差距!
第6章给办公系统的一些启示
6.1排序与字符串操作
6.2小数点数的计算与字符串/数字的换算
块数据输入输出和字段分割
统计带小数部分的数
整数转换成字符串
性能优化的效果
6.3半角字符转换为全角字符
判定字符的字节数
ASCII字符与半角片假名字符的判定
ASCII字符转换为全角字符
半角字符转换为全角字符
性能优化的效果
判定字符字节数的其他方法
有关UTF—8
6.4探索具有某种数据特性的数组
数据的特性
二分法查找与线性查找相结合
性能优化的效果
后记

文摘
版权页:

C程序性能优化:20个实验与达人技巧

插图:

C程序性能优化:20个实验与达人技巧

6.1 排序与字符串操作
在办公系统中经常会进行数据规范化处理,以及排序、分类、统计、数据的变形等。但随着数据量的不断增加,数据处理速度难免逐渐降低。每晚花费几个小时来批量处理数据也不能按时完成,给第二天的工作带来不便,这样的例子在现实生活中比比皆是。为了减轻服务器的负担,大家都希望能将服务器程序的执行时间缩短。
一般来说,办公程序中多半的数据排序和字符串操作都比较耗时,所以高效的优化策略就成了解决问题的焦点所在。在这一章中,我们会从USP研究所使用办公系统工具群“Unieage Command”的优化案例中甄选几个来进行讲解。虽然形式上有些不同,但都是些常用的逻辑,想必对读者朋友来说还是能起到一定作用的。
当程序在处理数据时,如果数据结构较合理,那也就意味着会有了好的处理方法(算法)。相反,处理结构不合理的数据就会拉长执行时间。也是基于这样的出发点,本书在最后选取了处理数据性质的案例。
6.2小数点数的计算与字符串/数字的换算
本章所使用的程序sm2先输入由空格来分隔开的数据行,然后按类别统计各字段的总和。表示分类类别的字段和作为被统计对象的字段将在程序执行时进行分配。
这是个通用版的程序,如果有具体案例的话就能更好地把握其要点。截图6—1中的数据是连锁店上传的销售额。将这些数据的第4至第7个字段按相同的分店名合并起来,并以第一个字段按顺序输出,其结果请看截图6—2。
该程序在编写好之后实施了几次性能优化,最终改善后的速度是起初的6.38倍。有关改善的方法后面会进行说明。
块数据输入输出和字段分割
sm2程序需要进行海量数据的输入输出,如果能对输入输出环节进行优化那就再好不过了。因此我们在操作时不使用库函数getline,而是在自定义大小的输入输出函数中定义4MB的输入缓冲区,然后将数据直接读入缓冲区,需要时从中取出一行的数据就可以了。
另外,原本我们在用字段分解输入行的过程中使用的是strtok函数,如果能将strspn函数和strcspn函数结合起来使用,效率将会得到提升。

内容简介
《C程序性能优化:20个实验与达人技巧》从CPU与编译器的运行机制讲起,带领读者一步步了解程序的执行成本、编译器的优化选项等,总结出许多C程序性能优化的技巧,并以实验的方式进行了讲解,简明易懂,使人印象深刻。书中带有大量的代码实例,使读者不仅能够了解代码优化的原理,还能够轻松地在实践中应用。《C程序性能优化:20个实验与达人技巧》适合有一定基础的C语言编程人员阅读。

购买书籍

当当网购书 京东购书 卓越购书

PDF电子书下载地址

相关书籍

搜索更多