株式会社エス・エム・エス様
介護ソフトはGWや年末年始にアクセスが集中。安定稼働が信頼に繋がる
利用サービス
ご利用いただいてるサイトの概要
介護事業者は中小規模が多く、深刻な人手不足な上に、紙書類作成などの介護以外の業務に追われ、本来のケアに向き合えないなど、非効率な経営・運営をされているケースが多くあります。
経営・運営にまつわる悩み全般をなんとか支援できないかという観点で生まれたのが「カイポケ」です。
「カイポケ」は、介護事業者の経営・財務安定化及び業務負荷削減をサポートし、介護事業者が目指す「理想の介護」実現を全面的に支援するサービスです。
お持ちだった課題
依頼前の状況として、リソースリークやアプリケーションのパフォーマンスなどが原因で継続的にサービスの高負荷な状態が続き、サービス運営に支障をきたしていました。
扱っているサービスは日本有数の規模の介護ソフトであり、当時のインフラ体制では原因の切り分けとトラブルシュートのスピードがサービス規模に追いついておらず、インフラ運用体制の早期での強化が事業課題となっていました。
Elastic Infraの強みはトラブルシュートのときに原因をとことん深くまで追い、表面上の動作不良の解消でなく構成全体の中での問題を的確に発見してくれる点とその解消のための提案・実行力だと考えており、アプリケーションまで含めて課題の分析をして共に課題解消をしてくれる会社は他に思い浮かばなかったため彼らに依頼をしました。
弊社にご依頼いただいてよかった点
2017年9月から委託しての運用が開始したが、その後高負荷起因で顧客へ迷惑をかける事態は一度も起きていません。
介護ソフトのサービス特性として月初の請求期間で特に営業日が少ないゴールデンウィークや年末年始に極端にアクセスが集中し、例年サービスレベルが著しく下がることが起きていましたが、まったく心配せずに自分たちの業務へ集中することができるようになりました。
営業日数の少ない中で顧客も請求業務をしているはずで、その期間にサービス運営起因で迷惑をかけなくなったのは大変価値があることで、感謝しています。
他社の介護ソフトもこの時期の安定稼働には苦戦している状況を見ているので、サービスの信頼回復と向上という面でも非常に大きなことだと感じています。
トラブルシュートの速さに救われたこともあります。運用する中で Aurora でテンポラリテーブル周りのエラーが頻発することがあり、ログインに問題が出るなどサービス影響の出る障害となりました。原因は MySQL のメモリリークバグにまつわるもので原因の特定は難度の高いものだったが、原因の見立ては発生後早期についており、対応をしてサービスの復旧までにかかった時間も1時間半程度と最小の被害で済みました。
運用をしていく中で問題は出るものですが、一つ一つの問題発生都度、深く原因調査をして再発しないよう根本の問題をつぶしていく姿勢とそれを可能にする技術力が日々の安定した稼働を支えてくれています。
運用チームから
規模が大きく、また運用課題を数多く抱えておられたため、とにかく移行後の改善効率をあげられるようにするための設計に尽力しました。
結果として移行後にはログを随時Kinesis Firehose経由でElasticSearchに流すことでリアルタイムなログ閲覧を実現したり、Codepipline + CodebuildによるDB migrationを導入したりとマネージドサービスの活用による運用効率化が進められています。
また、開発環境の構築をvpcから全てterraformで実現して納品することで弊社運用管理外でもお客様が独自に検証を進められるような環境を用意いたしました。