お客様の案件でAWSのRDSにおいてクラスターを構築していますが、db.r5.8xlargeにおいてAuto Scalingでリーダーを自動増強できないというトラブルに見舞われています。幸いサイト自体につながらないという状態は回避できております。
Auto Scaling アクティビティのログに以下のようなものが残っています。
Failed when adding read replica(s) application-autoscaling-xxxxx-xxxx-xxxx-xxxx-xxxxxx, application-autoscaling-xxxxx-xxxx-xxxx-xxxx-xxxxxx, application-autoscaling-xxxxx-xxxx-xxxx-xxxx-xxxxxx application-autoscaling-xxxxx-xxxx-xxxx-xxxx-xxxxxx. Reason: The selected instance class ‘db.r5.8xlarge‘ is not supported for the engine version of your snapshot. Please retry with an instance type supported by engine version ‘5.6.10a’ and then scale-compute to your desired instance type. (Service: AmazonRDS; Status Code: 400; Error Code: InvalidParameterCombination; Request ID: cccccc-xxxxx-xxxx-xxxx-xxxx-xxxxxx; Proxy: null).
ログがたくさん溜まっていて、いつからかわからないのですが、おそらく、3/25ぐらいからだと思います。ここのところ、忙しく、コンパネの確認をおろそかにしていた私のミスでもあります。
このエラーが自動実行時だけなのかを確認するために、手動でリーダーを追加できるか確認すると、同様にエラーとなりました。
The selected instance class ‘db.r5.8xlarge’ is not supported for the
engine version of your snapshot. Please retry with an instance type
supported by engine version ‘5.6.10a’ and then scale-compute to your
desired instance type.
現在のエンジンバージョンは5.7.mysql_aurora.2.07.2なので、おかしな話です。トラブルの予感がしたので、こういうときはAWSに問い合わせるのが一番です。すると回答があり、「一部の状況下のAurora MySQL DBクラスターにて、db.r5.8xlargeのようなインスタンスクラスのReaderを追加(CreateDBInstance)いただけない事象を確認」しているということでした。それも、「恐れ入りますが、修正時期の目途など将来の予定についてはお約束でき」という、おまけ付きです(# ゚Д゚)
提案された対処方法としては、db.r5.4xlargeなどで、一旦リーダーを起動させた後、db.r5.8xlargeにスケールアップするとdb.r5.8xlargeでリーダーを追加対応できるとのことでした。また、可能性としてですが、新しくスナップショットから復元すれば、正常にリーダーを起動することができるかも知れないということです。ただ、これだとdbのサイズが大きいだけに数時間、サイトがダウンしてしまうので、無理です。
いずれにしろ、Auto Scalingは動かないので手動で対応するしか無いため、このトラブルが続くまで、いろいろ不便です。