マルチクラウド、ハイブリッドクラウドの維持管理の課題と解決策とは

マルチクラウド、ハイブリッドクラウドの維持管理の課題と解決策とは

 マルチクラウド、ハイブリッドクラウドを維持管理するための課題として下記をはじめとする様々な課題が存在する。

  • クラウド基盤ごとに運用管理を統一
  • 複数のクラウド基盤を統合的に管理するツールの利用
  • 運用するSEの育成


 そこで伊藤忠テクノソリューションズ(以下、CTC)のクラウド維持管理の匠こと上田貴大氏に、クラウド環境を保つための運用管理やSEの教育に関わる課題解決策について尋ねてみた。

 マルチクラウド、ハイブリッドクラウドを維持管理に関わる課題解決に取り組まれる方は、本記事をご参考としていただきたい。



マルチクラウド、ハイブリッドクラウドの維持管理の課題と解決策

上田貴大



  • 上田貴大
    • 伊藤忠テクノソリューションズ株式会社在籍
    • マネージドサービス部カスタマーサービス課 課長
    • クラウド/DC/マネージドサービス利用顧客に向けた運用サービス業務を担当




▼ 目次
クラウドを維持、管理する上での課題とは
複数クラウド基盤の維持管理の課題に対する考え方とは




1. クラウドを維持、管理する上での課題とは

 マルチクラウド、ハイブリッドクラウドを維持管理する上での代表的な課題について尋ねてみた。



Q1-1. マルチクラウド、ハイブリッドクラウドの維持管理の課題とは?

上田 代表的な課題は、次の3点です。

    • 複数基盤の運用管理の統一
      • 複数のクラウド基盤を利用する上で、基盤ごとに運用内容、運用管理項目、監視項目、構成管理要素がそれぞれバラバラとなるため、運用レベルの統一性を図る必要がある
    • 複数基盤を統合的に管理する運用管理ツールの維持管理
      • 複数の基盤ごとに運用管理項目や構成要素が多岐に渡るため、運用管理ツールの維持管理も重要な取り組むべき課題となる
    • マルチクラウド、ハイブリッドクラウド環境を運用するSEの育成
      • マルチクラウド、ハイブリッドクラウド環境の複数基盤を維持管理していく運用SEとして、幅広い知識や技術の習得が必要となるため、エンジニア育成の 観点でも取り組むべき課題の一つとなる






2. 複数クラウド基盤の維持管理の課題に対する考え方とは

 マルチクラウド、ハイブリッドクラウドの維持管理の課題を解決していく上での運用管理の統一方法、運用管理機能に必要な機能、運用管理ツールの維持管理の重要性、SEの育成方法について尋ねてみた。

Q2-1. 複数の基盤ごとに運用管理を統一するにはどうしたら良いか?

上田 運用レベルやサービスレベルなど、品質を管理、統一する運用管理機能(運用管理者の役割)が必須となります。


マルチクラウド、ハイブリッドクラウドの維持管理の課題と解決策




 運用管理者の役割がないと、それぞれの基盤やサービスごとでバラバラな運用レベルやサービスレベルでの対応となってしまい、維持運用に関わる対応工数も余分に発生するケースもあります。また、システムの維持運用を行う上で重要なガバナンスを利かせるためにも重要な機能、役割を担うことになります。

 基盤ごとに、バラバラではなく一つの統一された維持運用を行う運用体制、機能が必要となります。

 下記のイメージ図では統合運用監視と表現しておりますが、基盤ごとにバラバラではなく一つの統一した機能・役割として運用チーム体制と各機能を構成することが重要となります。



マルチクラウド、ハイブリッドクラウドの維持管理の課題と解決策
図 1. 各基盤での運用管理機能の統一




Q2-2. 運用管理機能として必要な対応とは?

上田 基盤ごとに管理項目や運用内容が異なるため、凸凹がある部分を運用管理者にて管理ルールや運用方法を統一化する必要があります。


マルチクラウド、ハイブリッドクラウドの維持管理の課題と解決策




 具体例をあげると、例えばオンプレシステムでの構成管理要素とクラウド基盤システムで管理する構成要素では大きく異なりますので、運用ルールとしてオンプレシステムでは冗長性や可用性を考慮して障害対応時の対応基準を定めて、機器単体での復旧対応や保守対応の立て付けを行うことになります。

 一方でクラウド基盤システムでは、物理サーバとしてのリソース使用率と仮想ホスト上でのリソース使用率などの状況を見ながら、必要に応じて仮想ホストを別の物理サーバへ移動するような運用ルールを定めることもあるかと思います。

 通常は、システム上で自動的に移動される機能が有効化されていると思います。そのため、現実的な運用内容としては、システムで自動的に移動された後のホストの正常稼働状況を確認するという運用のほうが、よりリアルな実態といえるかも知れません。

 また、クラウド基盤システムでの物理サーバ障害では、対象サーバ上で起動している仮想ホスト単位での障害影響も考慮する必要もあり、より運用ルールや管理対象の幅が広がり、維持管理としての内容が煩雑なものになります。

 さらに、パブリッククラウド基盤システムの要素が加わると、各サービス独自の機能があり、その機能の正常性から機能が動作した後の正常性確認が入ってきたりするので、運用で求められる管理項目や運用内容は、どんどん膨れ上がってきています。

 こういった多種多様に膨大な運用管理項目を基盤ごとの特徴や機能性を考慮し一元的にシステム管理する役割を担い、統制を利かせることが運用管理者としての機能と考えます。




Q2-3. 運用管理ツールの維持管理の重要性とは?

上田 1点目の課題である「運用管理機能を統一」する上で運用管理ツールは重要な要素となります。


マルチクラウド、ハイブリッドクラウドの維持管理の課題と解決策




 運用管理ツールの活用方法として、日々の運用業務として利用する運用管理ツールは可能な限り、一つのツールに集約し、他のツール類とは疎結合して活用する形とすることが望ましいと考えます。

 理由としては、ただでさえ基盤ごとに管理項目や運用内容がバラバラで、必要とするツール類や運用業務で扱う製品群もそれぞれに複数存在する状態となりますので、それを一元管理する上で主として扱う運用管理ツールは一つに集約するべきなのです。

 また、3点目の課題である「マルチクラウド、ハイブリッドクラウド環境を運用するSEの育成」にも繋がりますが運用管理ツールのエンハンスも含めて維持管理する部隊も必要な機能となります。



マルチクラウド、ハイブリッドクラウドの維持管理の課題と解決策
図 2. 運用管理ツールの活用イメージ




 主となる運用管理ツールに各基盤システムからの情報を集約し、関連する運用ツール、システム群もこの管理ツールと連携して維持管理を行っていくことが必要となります。

 具体例としては、監視システムからのアラートをインシデントとして自動取り込みが行われ、インシデント発生を検知します。

 対象のインシデントに関連する構成管理要素や変更作業実施の有無、対象システムの利用ユーザ情報などを運用管理ツールのダッシュボード上で確認し、問題箇所の特定を行います。

 あわせて対象ユーザや運用担当者への自動エスカレーションが、オートコール機能で発報され障害発生の一斉通知メールや顧客ポータルへの障害情報通知を行います。関係各所への速やかな情報連携や報告を実施いたします。

 ここで重要となるのが主となる運用管理ツールと連携するシステム群やクラウド環境もまた、日々、進化し新たな機能や新製品、新バージョンが出てきます。

 これらの新たな機能を運用管理ツールでも受け入れるためにも、運用管理ツール自体の維持管理だけでなく、エンハンスするような機能も重要な維持管理業務の要素となります。




Q2-4. マルチクラウド、ハイブリッドクラウド環境を運用するSEの育成方法とは?

上田 この課題に対する考え方は、1点目の課題「複数基盤の運用管理の統一」と2点目の課題「複数基盤を統合的に管理する運用管理ツールの維持管理」への対応と紐づくものが基本で、各基盤の統一する運用管理者としての機能や運用管理ツールを維持管理するだけでなく、エンハンスする役割も担うSEを育成する必要があります。



マルチクラウド、ハイブリッドクラウドの維持管理の課題と解決策





 この2点の課題を解決するには、すべての基盤や運用ツール類に精通し、管理ツールのエンハンスも行えるようなスペシャルな人材が必要となってしまいます。 正直、現在のエンジニア不足の世の中でこのようなスペシャルな人員を確保することは不可能と言っても過言ではないかと思います。

 そこで本課題に対する考え方としては「基盤ごとのプロフェッショナルなエンジニアと連携し、運用業務を担っていくPM的な機能を備えたPJ推進スキルや、アカウントSEとしての内外とのコミュニケーションスキルを重要な要素として育成をしていく」という内容になります。

 簡単に言うと「餅は餅屋として専門性の高い知識や技術は専門部隊に任せる」ことです。運用SEは、各所とのコミュニケーションや調整コントロールを行う機能を重要視し、維持管理の体制を構築する考えです。



マルチクラウド、ハイブリッドクラウドの維持管理の課題と解決策
図 3. 運用体制イメージ




 強化を図るべき箇所としてあげさせていただいているのは、運用管理者で(弊社では運用PMという呼び方を使ったりもしていますが)、ここの部分が重要な育成ポイントだと考えています。

 繰り返しになりますが、ここの役割を担うにはPJ推進スキル(PM)やアカウントSEとしての内外とのコミュニケーションスキルが必要であるという考えになります。

 今後の取り組みとしてあげさせていただく内容にも繋がりますが、オペレータ機能やサービスデスク機能、運用担当者の一部役割は自動化を推進していく対象と考えます。 あわせて運用担当者としての役割から運用管理者や運用管理ツール担当へシフトしていくことを想定し、運用SEの育成計画を立てていくことが必要と考えます。




Q2-5. マルチクラウド、ハイブリッドクラウド環境の運用管理の課題に対して、CTCは何ができますか?

上田 主には2点あります。



2-5-1. マルチクラウド・ハイブリットクラウド環境でのサービス提供(運用サービス提供)

 基盤に依存せず、プラットフォーム間(パブリッククラウド⇔プライベートクラウド⇔オンプレといった)でのシームレスな連携や既存環境からの移行対応が可能なサービス提供を実施しております。

 システムごとの特性にあわせた最適な基盤を選択できます。

 また、基盤ごとのサービス提供も行っており、各基盤に特化したプロフェッショナルなサポート対応が可能です。


2-5-2. 運用管理機能の提供となる、運用PM機能、アカウントSE機能の提供

 課題となるマルチクラウド・ハイブリットクラウド環境に対する統一した運用管理を行う運用PM機能の提供が可能です。

 お客様システムの運用管理業務(構成管理、インシデント管理、変更管理)や、運用業務(変更作業、障害対応)を実施し、システムエンハンスやリプレース対応などアカウントSEとしての機能も運用SEにて対応可能です。

 お客様システムの構成や日々の対応業務も把握している運用SEが、運用の中であがってきた課題や要望をヒアリングし、構築やリプレース対応まで行います。





匠





まとめ

 マルチクラウド、ハイブリッドクラウド環境を保つための維持管理において、CTCでは次の4点に注力した取り組みを推進している。

  • 自動化
    • AIOpsを活用した日々の運用業務自動化を図っていく
    • 変更作業や障害対応などの運用業務はすべて自動化し、運用管理業務や自動化ツール類の維持、管理・エンハンス業務に稼働をシフト
  • 予測分析
    • 機器単位やインフラレイヤ単位の監視、管理に留まらず、システム全体の正常性を監視・管理し、障害予兆を捉えてプロアクティブな対応を実現
    • 障害が発生する前に対処して、未然に防止する取り組みを加速
  • 環境の変化への追随
    • 環境の変化への追随では、基盤ごとに日々変化していく機能、製品、アーキテクチャを継続的にウォッチして、維持管理業務へ反映し改善を図り、維持運用の中で”最適化”を継続し続ける
  • 運用SEの担当業務の変化
    • 従来の運用SEとしての役割からサイト・リライアビリティ・エンジニアリング (SRE)の役割へシフトし、運用管理業務やツール類の維持、管理・エンハンス業務にシフト



 人的作業はミスをすることを前提に、システムは想定外の障害が発生することを前提として考え、いち早く(できれば予測分析の中で未然に)異常を検知し、問題箇所を特定し、関係各所へ速やかに連絡、報告が行われつつ、並行して復旧対応、対処ができる仕組みと体制を整備することが、クラウドの維持運用に不可欠である。

 CTCは、マルチクラウド、ハイブリッドクラウドを維持管理に関わる課題の解決策を継続的に提供していく。



メルマガ配信のご登録はこちらから関連するセミナーやお役立ち情報をメルマガ配信します



著者プロフィール

著者アイコン
上田貴大
伊藤忠テクノソリューションズ株式会社在籍|クラウド/DC/マネージドサービス利用顧客に向けた運用サービス業務を担当

関連記事はこちら