当前位置:首页 >> 人群养生

谈谈几个值得关注的新特性计划

2021-09-06 12:18 来源:璧山县养生网

3.2.3 GCC 4.0 中的 Tree SSA 框架的设计和实现

至此,我们已经比较清楚的了解了什么是 SSA,SSA 形式有什么好处,如何将非 SSA表示转换成基于SSA形式的表示以及这个过程中需要解决的主要问题等等,本文将不再对SSA进行深入的讨论了,回到我们的主题,继续讨论GCC 4.0 的 Tree SSA 优化框架是如何设计和实现的,它是怎样把 Tree SSA 融入到 GCC 的编译过程中去的。

投资是拉动经济增长的关键 回顾上图2表示的 GCC 4.0 编译流程,在得到 GIMPLE Tree 之后,经过 GIMPLE optimizer 和 GIMPLE expander 的处理,得到了程序的 RTL 表示。其实把程序转换成SSA形式和在此基础上进行优化就在这个过程中完成的,下面我们就来具体看看 GCC 4.0 是怎么做的。在 GIMPLE 和 RTL 之间是树优化 (Tree Optimization) 的过程,如下图 5 所示。图 5 中所示的树优化器 (Tree Optimizer) 主要完成这几个功能:

1. 生成一个控制流转换图 CFG(Control Flow Graph)。

2. 将 GIMPLE Tree 转换成基于 SSA 形式的 Tree。

3. 进行 Tree SSA 的优化。

4. 将优化后的基于 SSA 形式的 Tree 转换成 RTL 接口所能识别的非 SSA Tree 的形式。

图5 GCC 4.0 的 Tree Optimizer 结构

结合 GCC 4.0 代码中的部分源文件来说明:图 5 中这个 Tree Optimizer 的行为是由tree-optimize.c 文件驱动的,tree-ssa.c, tree-into-ssa.c 以及 tree-outof-ssa.c 负责完成 SSA 形式的转换、验证以及其他需要与 SSA 形式交互的功能,建立和管理控制流转换图 CFG 的工作由 tree-cfg.c 完成。不同的树分析和优化功能分别在相应的源文件中独立实现,这些分析和优化函数必须向 GCC 注册,然后才能由 tree-optimize.c 进行驱动和管理,结合图 5来看,SSA pass1, SSA pass2 … SSA passn 代表了实现各种不同功能的 SSA 分析器,他们向 Tree Optimizer 注册,在编译时刻 Tree Optimizer 根据编译选项等等选择相应的SSA分析器进行优化或者其他处理工作,并保证在基于 SSA 形式的处理完成之后将 SSA 树转换成非 SSA树,交给下面的 RTL 模块处理。

至此,GCC 4.0 的 Tree SSA 优化框架结构应该比较清楚了。读者可能会注意到,文中多次提到Tree SSA是一个优化框架结构(Optimization Infrastructure),为什么说是一个Infrastructure 呢?其实把 Infrastructure 称作框架结构或许并不贴切,更精确地说 Tree SSA是 GCC 提供的一种进行优化工作的基础设施。图 5 中已经体现出了这一点,Tree SSA 的分析和优化工作不是一成不变的,具体选择哪些优化功能和算法是由Tree Optimizer选择驱动的,而且这个Infrastructure是相当灵活的,我们可以很方便的加入一个 SSA 分析器,只需要如下步骤:

1. 创建一个 struct tree_opt_pass 类型的全局变量。

2. 在 tree-pass.h 头文件中为这个新的分析器添加一个外部声明(extern declaration)。

3. 调用 NEXT_PASS 把这个新的分析器加入到 tree-optimize.c: init_tree_optimization_passes 序列中。

所以这种 Infrastructure 是一个相当灵活和方便的设计,使得我们可以便利地加入新的SSA分析器,或者使用更高效的算法来重新设计完成一些优化功能等等。

4. 总结

GCC 4.0 发布以来得到了引起了广泛的关注,新的 gfortran 前端给 Fortran 程序员带来了福音,但也有很多不尽如人意的地方,比如编译性能的损耗,以及向后兼容问题。比如KDE(K Desktop Environment) 开发小组在发现 GCC 4.0 无法正常编译 KDE 后,迅速的抛弃了 GCC 4.0。而且,出于稳定性的考虑,GCC 3.x 版本的开发仍然在进行中。这些似乎给 GCC 4.0 的前景笼罩上了一层阴影,但我们应该容忍一点,给 GCC 4.0 一些信心,向后兼容的问题应该是能够解决的。

至于编译性能的问题,通过我们这篇文章的讨论,我们可以看到 GCC 4.0 Tree SSA 的优化框架结构并没有充分发挥出其潜能,还可以增加和改进更多 Tree SSA 的优化工作,假以时日,GCC 4.0 的编译性能会得到提高的。

总的来说,这次 GCC 从 3.x 版本跃迁到 4.x 版本更像一个进化 (evolution) 的过程,而非一个革命性 (revolution) 的过程,它采用的 Tree SSA 优化框架代表了编译器发展的方向,我们应该关注 GCC 4.0 的进一步发展。

5. 参考文献

[1] Tree SSA: A New Optimization Infrastructure for GCC. Diego Novillo, Red Hat Canada, Ltd.发表在 GCC Developers Summit 上。

[2] Kenneth Zadeck在GCCGNU Toolchain Developers\' Summit 2004 上做的关于 SSA 的报告,Static Single Assignment Form。

[3] Design and Implementation of Tree SSA. 仍然是 Diego Novillo 在 GCC Developers Summit 上发表的文章。

[4] Scott Robert Ladd 的《GCC 4.0: A Review for AMD and Intel Processors》,对 GCC 4.0 和GCC 3.4.3 的性能做了评测,。

[5] GNU 主页上关于 GCC Tree SSA branch 的说明,。

关于作者

王逸,南京大学计算机科学与技术系在读博士生,对软件安全、Linux、编译器等比较有兴趣,目前主要关注的是隐蔽信道分析。

一品红药业
台州卵巢炎治疗多少钱
聊城哪有专治白癜风医院
相关阅读
如何在小学打造一间现代科学教室?

都说生物科学普及教育是提升全民生物科学专业性、 新建国际化型发逾国家的基础 那么,幼稚园生物科学普及教育 对从小唤起和保护孩子的好奇心和求知欲 培养学生的生物科学精神和实践国际化能力 具有重要含...

美国将公布不可忽视纪要,美联储或加息100个基点,明天A股会大跌吗?

现今,A股2台自主性,早盘三大期货虽有发挥作用涨跌的观感,但在恐慌抛盘的坠地下,最终没能稳住,跌势一直道股价。两市南先于攀升数量居多,攀升的有1298只,攀升的有3325只。归纳原因,与这四点有关:1、...

YOOT TOY REBEL BEAR 叛逆小熊 胆量与疯子 爱因斯坦 毛绒玩偶

YOOT TOY发布REBEL BEAR蛮横小乌鸦天才与屠夫新作相对论毛绒公仔 蛮横乌鸦 天才与屠夫新作 商品品牌:YOOT TOY 商品品名:蛮横乌鸦天才与屠夫新作REBEL ALBERT相对论 商品订制:磁吸项链、磁吸胡子、茶壶、背包、透明...

领导之所以不提拔你,是因为你没有这3样两边,别再蠢了

在基本单位中如果你一切都是让他组织晋升你,你一定要拥有这三都为进去,他组织只会晋升,有气魄的人,一定会晋升软弱无能的人,当你还没收到他组织晋升的时候,一定要可先好好得道自己。 他组织之所以...

美股短线跳水,三大股指尽数转跌

铝媒体 App 5月20日第一时间,美股短线艺术体操,三大期货剩余转跌。截至目前,道指跌0.3%,标普500指数、纳指跌0.15%。马斯克跌超5%,英伟达跌超3%,雅虎跌近1%。急救护理哪个血糖仪比较可靠骨质疏松吃什么补的...

翡翠要养是不是却是新鲜感?这就是“人养玉,玉养人”的意义所在

听惯了园中的督导,因为这些都是有全人类的木本植物,如果说起珍珠要养是不是有点乐趣?说是珍珠就是石之美者,是一块经过地壳运动在一定的密度和压力中的形成的。所以珍珠是大其本质中的的诸城也是需要...

友情链接