タイトル: クラスタ型データパスによるスーパースカラプロセッサの低消費電力化
著者: 佐藤, 幸紀
鈴木, 健一
中村, 維男
発行日: 2007-08-15
出版者: 情報処理学会
誌名: 情報処理学会論文誌:コンピューティングシステム
巻: 48
号: SIG13(ACS19)
開始ページ: 84
終了ページ: 94
抄録: スーパースカラ方式プロセッサの広域的なデータパスを複数の局所性を持つ処理要素(PE)に分割してクラスタ化することにより、低消費電力で高並列な処理が可能である。しかしながら、データパスを分割する度合いを増すにつれて、局所化された処理要素間の通信や負荷不均衡により高並列な PE が効果的に活用できないため、結果的にクラスタ化を行わない場合と比べて性能が低下する恐れがある。本論文では、クラスタ型スーパースカラプロセッサの利点である低消費電力性をさらに引き出すために、クラスタ化を進めた場合の IPC の低下を抑える手法を提案する。局所化された処理要素を効率良く利用するために、プログラムに内在する命令の逐次性に着目する。プログラムの逐次性の指標としてプログラム実行時のオペランドの状態とレジスタファンアウトを利用してプログラムの逐次性をクラスタ型プロセッサの局所的処理に対応させる。さらに、局所化された高並列な処理要素を有効利用するために隣接する PE において協調処理を行うことを提案する。実行駆動シミュレーションを実施した結果、隣接 PE の協調を行うことにより、高並列な処理要素を効率良く利用しつつ、レジスタファイルの消費電力をクラスタ化を行わない場合と比べて 12 分の1 程度に削減可能であることが分かった。 : Recently, clustering the complex and centralized datapaths of superscalar processors into localized PEs (clusters) becomes a popular approach to realize low-power and highly-parallelized processors. However, clustering tends to decrease the performance of a processor because of inter-PE communication and workload imbalance among PEs. In this paper, we focus on sequentiality of instructions in programs and apply it to the localized processing on clustered processors. From the analysis of sequentiality using operand status and register fanout, we present that cooperation of neighboring PEs is an effective approach to perform localized processing in a clustered processor. From the results of execution-driven simulations, a clustered processor with the cooperation of neighboring PE achieves better IPC with faster, smaller and lower energy register files than other schemes so far considered. This means that the clustering with the cooperation of neighboring PEs boosts the advantages of clustered processors.
