SRE

CDKTFで実現するコミューンのインフラストラクチャ改善

SRE

はじめに はじめまして、コミューン開発 SRE チーム の池田です。 今回は「コミューンのインフラにおける課題」を解決するために Cloud Development Kit for Terraform (CDKTF) を導入しましたので、導入の進め方やよかったところについてご紹介したいと思い…

Cloud Load Balancingのログでtimestampが実際より前になる現象

SRE

はじめに SREチームの磯村です。 コミューンではクラウド基盤としてGoogle Cloudを利用しています。 ユーザーのブラウザからのリクエストはCloud Load Balancing経由してCloud Run上のプログラムに渡されます。 このため、一つのリクエストに対してCloud Loa…

CI/CDをCloud Buildへ乗り換えたついでにリリースを10分以上短縮した話

SRE

はじめに コミューンではこれまでCI/CDのツールにCircleCIを使っていましたが、最近Cloud Buildへ切り替えました。 結論から言うと、切り替えにあたってパイプラインの中身とプロセスを今一度見直したところ、以下のように改善しました。 ビルド回数:2回 ->…

Cloud Build上でNext.jsのコンテナイメージのビルド速度を改善した話

はじめに SREチームの磯村です。 去年入社してからフロントエンドエンジニアとして働いていましたが今年6月からはSREチームに転属しました。 SRE見習いとして奮闘中です。 コミューンはアプリケーションの基盤としてGoogle CloudのCloud Runを利用しています…

『Terraform と gcloud CLI を使用した完璧な Google Cloud インフラストラクチャの構築』は本当に完璧なのかやってみた

SRE

はじめに コミューンのインフラにおける課題 使ってみた 既存のGCPのリソースをTerraform形式でエクスポートする main.tfを作成する 既存のGCPリソースをインポートする terraform planで実行計画を見る 1. google_compute_route 2. google_compute_ssl_cert…

コミューンのアーキテクチャ選定

SRE

はじめに そもそもcommmune って何? サービスの紹介 特性について 旧アーキテクチャとその問題点 問題1:増減するトラフィックに対してコスト最適なマシンスペックを設定するのが運用上難しかった 問題2:トラフィックのスパイクでサービスが過度に不安定…

倒れたときの応急処置をGCPにお願いする

SRE

倒れても自力で立ち上がろうとするインフラが好きなSREチームの川岡です。 サービスがダウンした時の応急処置くらいは自動化できないものかと思い、Cloud Pub/SubをトリガーにCloud FunctionsからCompute EngineへSSHでアクセスしてインスタンス上のアプリケ…

waiting for metadata lockにもう負けない。GCP CloudSQL上で開きっぱなしのTransactionの探し方。

SRE

あけましておめでとうございます エンジニアの前原です。 皆さん、年末はいかがお過ごしでしたか? 私ですか? 私は12/28の夕方まで障害の原因追求に奔走してました。なんとか年内に調査完了して安堵したのを覚えています。 折角なので今回はその問題につい…