freeeの開発情報ポータルサイト

SRE

AWSのよくある構成を地図に載せてみた

この記事は freee Developers Advent Calendar 2025 12/24 (24日目) の記事です。 こんにちは。今日はクリスマスイブですね SRE の min です 今年は 10 月に AWS で大きめの障害がありました 普段当たり前に使える AWS リソースがいきなり使えなくなる体験…

EKS移行でSRE支援体制を強化したfreeeサインの事例

freeeサインのインフラをECSからEKSへ移行することで、SRE全体での支援体制を強化し、開発生産性を向上させる取り組みを紹介します。

ClickHouseを導入する前に知っておきたかったこと:SaaSのネットワーク制約とセルフホストの勘所

この記事は、freee Developers Advent Calendar 2025 の 16日目の記事となります。 adventar.org フリー Platform Engineerのyuriaです。 昨日のpon さんのアドベントカレンダー記事「 LangfuseバージョンアップのためにClickHouseを社内初導入した話 」 でL…

Langfuse のバージョンアップに伴い ClickHouse を社内初導入した話

この記事は freee Developers Advent Calendar 2025 の15日目になります。 昨日はけむりだまさんが 「freee技術の日」に関する記事を投稿してくれました! 技術カンファレンスの裏側で運営を円滑にするために使われた技術について解説してくれています、ぜひ…

Security Group for Pods 詳解

この記事は freee Developers Advent Calendar 2025 12/10(10日目) の記事となります。 adventar.org 昨日は kochan さんの AIを使って雑にアプリを作る企画の振り返り でした。 対話形式のアドベンドカレンダー新鮮でした。自分が AI で日々感じてることも…

Vectorの魅力を語る!ログ収集ツールとしての可能性について

Vectorのロゴ vector.devより引用 こんにちは! SREのzakiです。この記事は、freee Developers Advent Calendar 2025 の 4日目の記事です。 はじめに Vectorの検証を始めた動機 Vectorの使い方速習 基本コンセプト 動かし方 Vectorの良さ 設定ファイルをテス…

MySQLのロック継承が引き起こしたsupremumロックによるDB障害事例

こんにちは、DBREの周東(X: @dev_kngnr)です。 DBRE では、freee の全プロダクトが利用するデータストア層の信頼性向上をミッションとしています。その活動の一環としてDB障害の原因の調査や、再発防止策の検討を行っています。この記事では、freee のとあ…

KubeCon + CloudNativeCon Japan 2025 - 参加レポ: 『Your SBOM Is Lying To You – Let’s Make It Honest』

developers.freee.co.jp こんにちは!freee のSREをやっているのyamaです。普段は主にコスト統制をメインに担当しています。 今回は少し毛色が違いますがKubeCon + CloudNativeCon Japan 2025から「Your SBOM Is Lying To You – Let’s Make It Honest」につ…

KubeCon + CloudNativeCon Japan 2025 - 参加レポ Never Underestimate Memory Architecture/No More Disruption: PlayStation Network’s Approaches To Avoid Outages on Kubernetes Platform

KubeCon + CloudNativeCon Japan 2025 参加レポ 4 日目を担当する SRE の kamimuu と申します。 freee では新規マイクロサービスの構築支援やマルチ AWS アカウント環境の運用を担当しています。 本記事では私が興味を惹かれた以下 2 つのセッションを紹介し…

KubeCon + CloudNativeCon Japan 2025 - 参加レポ: From ECS To Kubernetes (and Sometimes Back Again): A Pragmatist's Guide To Migration

developers.freee.co.jp こんにちは。freee の SRE チームに所属している nkgw (X) です。 KubeCon + CloudNativeCon Japan 2025 参加レポート 3日目を担当します。 先日開催された KubeCon + CloudNativeCon Japan 2025、楽しかったですね。 その中でも特…

KubeCon + CloudNativeCon Japan 2025 - 参加レポ What's New in Open Source Kubernetes?/Access AI Models Anywhere: Scaling AI Traffic With Envoy AI Gateway

developers.freee.co.jp KubeCon + CloudNativeCon Japan 2025 参加レポ 2日目を担当する SRE の sho と言います。freee では EKS の運用や新しい EKS プラットフォームの設計・構築を担当しています。 自分からは以下2つのセッションを紹介させてもらいます…

KubeCon + CloudNativeCon Japan 2025 に参加しました!

はじめまして、24卒として新卒で入社したSREのponです。 今回freeeのSREから7名が、2025年6月16日・17日に開催されたKubeCon + CloudNativeCon Japan 2025に参加しました。 参加記念写真 これから4日間にかけて、KubeConに参加したメンバーによる参加レポー…

2025/8/5, 8/6 フリー株式会社 Google Cloud Next Tokyo に登壇

フリー株式会社は、2025年8月5日(火)、6日(水) に開催される Google Cloud Next Tokyo (主催:グーグル・クラウド・ジャパン合同会社) に登壇いたします。 弊社エンジニア城谷、西が8月6日(水) 17:00 - 17:30 に、 freee が目指す生成 AI 時代に向けた次世代…

2025/5/28 「Datadog RUM 本番導入までの道 」登壇資料

2025年5月28日に行われた、Japan Datadog User Group Meetup #10 @東京 での登壇資料です。 speakerdeck.com

確定申告ピークに備えるfreeeのキャパシティプランニング

こんにちは、SREの清水です。 この記事では、2025年の確定申告に向けてfreeeで行ったキャパシティプランニングの取り組みについてご紹介します。 freeeと確定申告 freeeでは個人事業主や法人向けのクラウド会計ソフトであるfreee会計1を提供しています。free…

E2Eテスト分析基盤としてReportPortalを導入しました!

E2Eテスト分析基盤としてReportPortalを導入しました

Terraform Monorepo の CI の実行時間を可視化し 2 分以上高速化

SRE team の suzuki-shunsuke です。 今年の 8 月(約3か月前)から freee の SRE team に join しました。 本記事では Terraform Monorepo の CI の実行時間を CIAnalyzer で可視化し 2 分 (70 percentile で約 160 %) 以上高速化した話を紹介します。 背景 f…

『AWS Jam』に参加しました!!

はじめに こんにちは! SRE Platform Deliveryチームで内定者インターンをしているhagiです。 今回は9月3日に社内で開催されたAWS Jamに参加したので、その様子や感想をお伝えします! そもそもAWS Jamって何? AWS Jamの公式サイトから抜粋すると、次のよう…

Aurora 3.04.2 での DDL の予期しない挙動と Rails での対策

こんにちは、DBRE (Database Reliability Engineer) の shinta です。 今回は、Aurora MySQL 3.04.2 に存在する DDL の予期しない挙動について紹介したいと思います。 発見のきっかけ きっかけは、Aurora MySQL 3.04.1 に存在した以下の事象の検証でした。(…

CloudNative Days Summer 2024 に参加しました!!

SRE

はじめに こんにちは! 6/15 に札幌で開催された CloudNative Days Summer 2024 (CNDS) に参加してきたので、その様子をお伝えします! freee からは SRE Platform Delivery チームの akito と tetora が参加しました。 会場:札幌コンベンションセンター 前…

freeeサインのAWSリージョンを移行した話

この記事はfreee 基盤チーム Advent Calendar 2023 の24日目の記事です。 はじめに はじめまして! kanno と申します。freee SREで、freeeサインのプロダクトSREを担当しておりAWSインフラの改善や運用を主に行っています。初回の投稿で拙い文章になりますが…

freee会計の月末のDB負荷を減らしたい!

こんにちは、freee 基盤チーム advent calendar の 21 日目担当、DBRE (Database Reliability Engineer) の shinta です。今年新卒入社しました。 freee の中でも一番のリクエスト数を誇る freee会計の DB は、月末に負荷が高まって色んなアラートを発報する…

Terragruntで快適なTerraformライフをめざす

Gruntwork社が公開しているTerraformのラッパーツール「Terragrunt」について、基礎的な概念や主要機能、使用方法について紹介します。Terragruntを用いてDRYにTerraformコードを書くことで、インフラの設定管理を効率化を目指しましょう!

アラーティングガイドラインで秩序を取り戻せ

こんにちは Enabling SRE teamに所属しているSREのchoreです! この記事は freee 基盤チームアドベントカレンダー の17日目になります。 今回は freeeにおけるモニタリング運用の話をさせて頂きます。 背景 freeeではインフラやプラットフォーム周りのエラー…

AWS のコスト統制の道

SRE 統制チームの oracle です。 この記事は freee 基盤チームアドベントカレンダー の16日目になります。 今回は AWS の コスト統制についてお話させて頂きたいと思います。 先日「 AWS の組織移行をしました 」という記事の中で AWS の組織移行のために SR…

多様なプロダクトが存在する freee における health check 標準化

こんにちは。freee の Platform Solution チーム1 に所属している nkgw (Twitter) です。 この記事は freee 基盤チーム Advent Calendar 2023 の 15 日目の記事となります。 普段は、エンジニアリングマネージャーをしつつ、新規プロダクトのリリースサポ…

AWS の組織移行をしました

SRE 統制チームの oracle です。 この記事は freee 基盤チームアドベントカレンダー の12日目になります。 今回は AWS の 組織移行を行った話をさせて頂きます。 AWS の 組織移行というのはどういうこと?と思われる方もいらっしゃるかと思いますので、正し…

PagerDutyを用いたアラート対応改善の取り組みとTips紹介

はじめに こんにちは!freee の Enabling SRE チームに所属している阿部 寛明 (uryy)と申します。freeeのシステムを運用する際にはDatadogからの通知をもとにアラート対応するケースが多いのですが、組織拡大により従来の方法ではうまくワークしない箇所もで…

OneLogin + Terraform によるアカウント管理・権限管理基盤の紹介

本記事はfreee基盤チームアドベントカレンダーの7日目です。 昨日のWaTTsonさんの記事は色んな意味で強烈な内容でしたね。未見の人は是非チェックを。 今日の記事は少し渋目な感じになります。 はじめに あらためましてこんにちは、SREの河村(at-k)です。今…

インフラ爆速構築記〜freeeの場合〜

こんにちは。この記事は freee基盤チームアドベントカレンダー の4日目になります。 認証認可基盤チームのアプリケーションエンジニアを担当している てらら です。 社内の人にはエンジニアではなく、freee Tech Nightの司会の人、またはSlackで良く見かける…

ArgoCDバージョンアップを安全かつ迅速に行うための取り組み

概要 freeeではAmazon Web Services (AWS) Elastic Kuerbentes Service (EKS) 上にほとんどのアプリケーションが載っており、EKSへのデプロイ基盤としてはOSSの ArgoCD を利用しています。 ArgoCDから各クラスタにデプロイを行うため、非常に中央集権的なア…

スクラム知識0のチームが3ヶ月スクラムを回してみたらめちゃくちゃ良かった話

こんにちは Enabling SRE team(通称hayabusa)に所属しているSREのchoreです! この記事はfreee Developers Advent Calendar 2023 - Adventar 2日目です。 内容としてはスクラムが右も左も分からないチームがスクラムを回していってどうなったかを書いていま…

freee 基盤チームアドベントカレンダーの歩き方

SREの河村(at-k)です。 本記事は freee基盤チームアドベントカレンダー の1日目になります。 カレンダー企画にあたり 今年もこの季節がやってきました。年末に向けて冬が深まり、心なしか忙しなくなってくる中、毎日ブログが一本ずつ投稿されていくのを見て…

terraform stateの再設計に取り組んだ話

こんにちは!freee enabling sre teamに所属しているhamaa(濵田雄太)です。 この記事はfreee Developers Advent Calendar 2023 - Adventar 1日目です。 自分はfreeeにjoinし、おおよそ1年がたちました。この1年間で主にterraform state再設計、移行につい…

CloudNative Days Fukuoka 2023に参加しました!

こんにちは、SRE Platformチームのmohaと申します。 去る8/3、CloudNative Days Fukuoka 2023が開催されました。freeeからはSRE Developer eXperience (DX) チームのmiyahikaが登壇したほか、Dev brandingチームとSRE、PSIRTの有志がブース運営のため参加し…

Project間の依存関係の図示

ことのはじめ こんにちは、freeeのSREの久保木です。 freeeにはたくさんのProjectがあり、それらが複雑に依存関係を持ちます。 ですが僕はSREという所属上いったんはこれら全てに関与する可能性があります。なのでどんなProjectがあって、どれとどれがどう関…

RDS Proxyを用いたオンラインスイッチオーバーによるMySQLのアップグレードについて

おはこんばんちは、DBREの橋本です。 今回は、Amazon RDS Proxy(以降RDS Proxyとよぶ)を用いたRDS for MySQLインスタンスおよびAurora MySQLクラスタのオンラインスイッチオーバーの手法について、ある程度社内での運用が確立してきましたので解説いたしま…

Performance Schemaの仕組みと活用法の紹介

メリークリスマス!!freee Developers Advent Calendar 2022 25日目担当のid:shallow1729です!昨日はtdtdsさんでfreee特有の風土病:エンジニアの症例と寛解についてでした! 僕からはMySQLのPerformance Schemaという機能の仕組みの解説とfreeeでの活用に…

freee での SLO の実践について

Enabling SRE チームの oracle です。 チーム内で SLO の推進を担当しております。 freee での SLO の実践についてご紹介させて頂きます。 改めてSREとは 皆さんご存知のように SRE とは Google 社が実践してきたシステム運用のノウハウを書籍化したことで一…

ソフトウェア開発ライフサイクルに SRE という文化を Enabling していくためのアプローチ

こんにちは。freee の Enabling SRE チームに所属している nkgw (Twitter) です。 freee Developers Advent Calendar 2022 の 15 日目の記事となります。 普段は、エンジニアリングマネージャーをしつつ、新規プロダクトのリリースサポートとか、envoy の…

SREへの社内留学を通してEnabling SREを推進した話

こんにちは、金融開発チームでアプリケーションエンジニアをしている ogugu です。 普段はサーバーサイド・フロントエンド問わず実装しています。 直近では、半分趣味でGoのlinterを自作したり、フロントエンドにStorybookのインタラクションテストを導入し…

AWSマネージドサービス+Terraformを活用してDBオペレーションをより安全&簡単に(pt-oscの例)

MySQLのスキーマ変更ツールであるpt-online-schema-changeを、AWSマネージドサービスを用いて実行させ、その作業を開発者に委譲する仕組みを紹介します。

2022: freee SRE Journey - これまでの振り返りとこれから

忙しい方向けサマリ EKS化・IaCの浸透・DB改善活動が、ここ数年のfreeeのインフラ事情の主だった動きです。 一方で組織・サービスも増えてきており、従来のワンチームSREでは色々と厳しくなってきました。 基盤も進化し、課題も変化した。それに伴い、SREの…

freee-SRE船-DX(Developer eXperience)でインターンしてみた

記事の目的 こんにちは、SRE船-DX(Developer eXperience)チームで内定者インターンをしていた22卒のakitoです。 昨年の11月から約5ヶ月間(週3勤務)でCI/CD周りの業務を担当したので、インターンの内容について共有したいと思います。 自分がSREでのインター…

AWSコスト倍になっちゃった!〜削減への道のり〜

こんにちは、DevBrandingのellyです。5月20日に配信した「AWSコスト倍になっちゃった!〜削減への道のり〜」の様子をご紹介します。 今回はITストラテジーチームとSREチームから2人のゲストを招いて、freeeで実際に起きたAWSコスト増加の事例をもとに、気が…

EKS環境下でコストが増大する事例とfreeeのアプローチ

はじめまして。freee の SRE チームに所属している nkgw (Twitter) です。 普段はエンジニアリングマネージャーをしつつ、開発チームの新規プロダクトリリースサポートをやっています。 我々のチームは大部分のプロダクトのコンピューティングリソース (CP…

pt-online-schema-changeの導入時に検討したこと、およびRailsアプリとの併用について

おはこんばんちは、Database Reliability Engineer (DBRE) の橋本です。今回は、pt-online-schema-changeというデータベースのスキーマ変更ツールを社内の運用に持っていくための過程や、freeeにおける運用上の工夫を紹介します。pt-online-schema-changeは…

Sysbench でカスタム負荷試験を書く

こんにちは、Database Reliability Engineer (DBRE) チームの寺沢です。 業務柄、負荷試験をする機会がちょこちょこあるのですが、sysbench のカスタムテストを書くのが意外に簡単であること、かつ想像よりも色々できて便利だったので、まだ使ってない方に向…

アプリチーム x SRE チームによるアプリケーションモニタリング運用改善

freee人事労務の品質改善を専任で活動している keik です。 freeeではアプリケーションパフォーマンスモニタリング(APM)に Datadog を利用しています。 SRE チームが導入し、アプリケーション開発チームに利用提供する形で運用されています。 導入のきっか…

Kubernetes の CronJob の急な停止に対応するための Tips

SRE の hatajoe です。 私が所属しているチームでは、これまで数多くのサービスのインフラ基盤を Amazon EKS へ移行してきました。 その過程で多くの乗り越えなければいけない課題に直面して来ましたが、今回は Kubernetes クラスタで安全に CronJob を扱う…