タイトル: 大規模サーバ間の部品依存関係に基づくログ管理支援法
著者: 敷田, 幹文
後藤, 宏志
発行日: 2008-03-15
出版者: 情報処理学会
誌名: 情報処理学会論文誌
巻: 49
号: 3
開始ページ: 1081
終了ページ: 1089
抄録: 近年,大企業や大学の情報システムは大規模サーバ群による集中管理を行う傾向にあり,それらのサーバにはきわめて高い信頼性が要求されている.そのような大規模システムの管理には,全体を把握する1 人のエキスパートではなく,複数人の管理者が分担して作業する組織が増えている.各管理者は,各サーバの様々なログファイルを参照することによって,障害の解析などに必要な多くの情報を得ている.従来の統合管理ソフトウェアでは,各種サーバのログ情報を一元管理し,設定した条件に従って管理者へ通知を行うことが可能である.しかし,大規模・複雑なシステムでは膨大な量のログ情報が発生しており,その中から現在必要な情報を発見することは困難である.本論文では,サーバの各部品や様々なサービスの間の依存関係に注目し,システム全体の全ログ情報の中から管理者が現在注目している事象に関連のあるログ情報を担当区分を越えて自動抽出する方式を提案する.たとえば,Web アプリケーションの管理者がログから障害情報を発見した場合に,他の管理者が管理するデータベースサーバや大規模ストレージの膨大なログ情報の中から,今回の障害に関係のある情報のみを自動抽出して参照できるため,大規模システムにおける各管理者の障害解析作業が効率化される.また,本方式を用いた試作システムでの実験結果から,本方式を用いた大規模サーバ群のログ情報管理支援の有効性に関する議論を行う. : In some large organizations such as a large enterprise or a university, large-scale servers are designed to organize large information systems. Reliability of the large-scale servers is key factor of managing those systems. In general, several administrators are needed to manage those systems instead of one expert. To get needed information for an analysis of system fault, administrators have to refer many kinds of log files of servers. It often involves some servers that are managed by the others. In current software for log management, many kinds of log information of several servers are unified. Administrators will be able to get system error information by such software if they give some parameters to the software in advance. However, it will be not so easy to find real needed information because of a huge number of log information in large-scale systems. In this paper, we focus on dependencies among components of large-scale servers and services. We propose an extracting method for getting the real needed log information based on these dependencies. Our proposed method can extract specific log information in connection about details of each system failure. We illustrate our proposed method with an experimental system and discuss its usefulness.
社団法人 情報処理学会, 敷田幹文/後藤宏志, 情報処理学会論文誌, 49(3), 2008, 1081-1089.
