入門監視を読んだのでメモ 監視のアンチパターン ツール依存 「何をやるか」というミッション駆動ではなく、やることがツールに制限される 出来ないことが増えるとツール批判が始まり、別のツールを探し始める 監視は複雑な問題を一括りにしたもの 問題解決のためにツールを増やすのも1つの手段 カーゴカルトなツールは避ける あのチームが成功しているからといった理由で選ばない 役割としての監視 属人化を避ける チーム全体がある程度のレベルになっておく チェックボックス監視 「これを監視しています」と言うために行なっている監視 CPU、メモリ使用率などは計測しているがシステムがダウンした理由はわからない 誤検知…
株式会社リゾーム 技術部 システム開発 第4グループの平松です。 読書会の第12回目のレポートです。 第11回目のレポートは、こちらになります。 tech.rhizome-e.com 入門 監視 ―モダンなモニタリングのためのデザインパターン作者:Mike Julianオライリー・ジャパンAmazon 12回目レポート 今回は、「付録C 実践 監視 SaaS C.6~C.8」で、参加者は5名でした。 それぞれの感想・意見交換 テスト駆動開発と監視 ソフトウェア開発とテストがセットであるように、システム運用と監視はセットで語られるべき システム運用側の視点が薄かったかなと思った 監視とテストを同…
株式会社リゾーム システム企画・開発部 第3グループの藤岡です。 入門監視 読書会の第11回目のレポートです。 10回目のレポートは、こちらになります。 tech.rhizome-e.com 読書会の題材 前回に引き続き 入門 監視 ―モダンなモニタリングのためのデザインパターン | Mike Julian, 松浦 隼人 |本 | 通販 | Amazon を題材としています。 11回目レポート 今回は、「11章 監視アセスメントの実行」と「付録C 実践 監視 SaaS C.1~C.5」で、参加者は5名でした。 感想・意見交換 ビジネスKPI 製品毎に何のメトリクスが取れるか 施設数(テナント数…
株式会社リゾーム システム企画・開発部 第3グループの渡邉です。 読書会の第10回目のレポートです。 第9回目のレポートは、こちらになります。tech.rhizome-e.com 読書会の題材 前回に引き続き 入門 監視 ―モダンなモニタリングのためのデザインパターン を題材としています。 10回目レポート 今回は、「10章 セキュリティ監視」で、参加者は6名でした。 それぞれの感想・意見交換 監視とコンプライアンス 出てきたキーワード、全てがHerokuに載っていたと思う。 こういうのでもっとカジュアルな規格とかがあればいいんだが。 この場合のすべてのログとは万一の事態が発生したときに、裁判…
株式会社リゾーム システム企画・開発部 システム管理のあめぎです。 入門監視 読書会の第9回目のレポートです。 第8回目のレポートは、こちらになります。 tech.rhizome-e.com 入門 監視 ―モダンなモニタリングのためのデザインパターン作者:Mike Julianオライリー・ジャパンAmazon 9回目レポート 今回は、「9章 ネットワーク監視」で、参加者は6名でした。 感想・意見交換 SNMP のつらさ SNMPはセキュアではないプロトコルらしい 古いけど代替がなく使わざるを得ないケースがあるらしい 大変そうだ デバイスが高負荷の時にはSNMPのエージェントの処理の優先度を下げ…
株式会社リゾーム システム企画・開発部 第4グループの尾古(@patorash)です。 入門監視 読書会の第8回目のレポートです。 第7回目のレポートは、こちらになります。 tech.rhizome-e.com 入門 監視 ―モダンなモニタリングのためのデザインパターン作者:Mike Julianオライリー・ジャパンAmazon 8回目レポート 今回は、「8章 サーバ監視」で、参加者は5名でした。 感想・意見交換 OSの標準的なメトリクス メトリクスは取るが、アラートは設定しない。確かに狼少年になってしまう。数値ではなく、意味の方が大事。 適切なインスタンスサイズを選ぶには、CPUやメモリの使…
株式会社リゾーム システム企画・開発部 第4グループの萩原です。 読書会の第7回目のレポートです。 第6回目のレポートは、こちらになります。 tech.rhizome-e.com 読書会の題材 前回に引き続き 入門 監視 ―モダンなモニタリングのためのデザインパターン を題材としています。 7回目レポート 今回は、「7章 アプリケーション監視」で、参加者は5名でした。 それぞれの感想・意見交換 メトリクスでアプリケーションを計測する クエリの実行時間や応答時間以外に、何を計測するべきか。 アプリケーションパフォーマンス監視(APM) そのままでも小綺麗な滝グラフ、それっぽいグラフは出るけれど、…
株式会社リゾーム システム企画・開発部 第3グループの渡邉です。 読書会の第6回目のレポートです。 第5回目のレポートは、こちらになります。 tech.rhizome-e.com 読書会の題材 前回に引き続き 入門 監視 ―モダンなモニタリングのためのデザインパターン を題材としています。 6回目レポート 今回は、「6章 フロントエンド監視」で、参加者は6名でした。 それぞれの感想・意見交換 フロントエンドのパフォーマンス・監視について フロントエンドのパフォーマンスについては気にはしているが、監視をするという考えはなかった。 「JavaScriptはbody閉じタグの直前で読み込め」とか、「…
株式会社リゾーム システム企画・開発部 第4グループの平松です。 読書会の第5回目のレポートです。 第4回目のレポートは、こちらになります。 tech.rhizome-e.com 読書会の題材 前回に引き続き 入門 監視 ―モダンなモニタリングのためのデザインパターン を題材としています。 5回目レポート 今回は、5章「ビジネスを監視する」で、参加者は5名でした。 それぞれの感想・意見交換 ビジネスKPI KPIはメトリクスって言われたら確かに。 これらのメトリクスはサービスを作るときに取得できるように設計しておかないと、次の打ち手を考えるときのデータがない。 月次での推移とか作ってみたら良さ…
株式会社リゾーム システム企画・開発部 第3グループの藤岡です。 読書会の第4回目のレポートです。 第3回目のレポートは、こちらになります。 tech.rhizome-e.com 読書会の題材 前回に引き続き 入門 監視 ―モダンなモニタリングのためのデザインパターン を題材としています。 4回目レポート 今回は4章「統計入門」で、参加者は4名でした。 それぞれの感想 システム運用における統計を学ぶ前に アラートが鳴りすぎるのは良くないので、フラッピング検出によるアラート制御が害悪か判断しかねる。 計算が救いの手を差し伸べる 過去のログも記録する、統計を見て何か掴む。 AWSを使って過去ログを…
こんにちは!Mackerel CRE の id:KGA です。Mackerel Tech Day のパネルディスカッション登壇者が決定しましたのでお知らせします! \ 10/22(火)開催!モニタリング・オブザーバビリティの変遷とこれからの展望!/ 🆕 関連書籍の訳者・執筆者が集結!パネルディスカッションで迫るモニタリング・オブザーバビリティ今昔 本イベントでは、モニタリングとオブザーバビリティの実践をもとにした変遷や、これからの展望がわかるコンテンツをご用意しています。 パネルディスカッションでは、セッション登壇者の山口様(@ymotongpoo)に加え、株式会社ヘンリー 松木様(@song…
ITP2(合計:61h 今月:14h) プログラミング HCW(合計:61h 今月:7h) テスト準備 DM(合計:106h 今月:20h) テスト準備 ADS1(合計:65h 今月:14h) テスト準備 これからやること AWS入門する ECS Webエンジニアが知っておきたいインフラの基 入門監視 クリーンアーキテクチャ 実践ハイパフォーマンスMySQL 第3版 プログラミングコンテスト攻略のためのアルゴリズムとデータ構造 停滞気味 Linuxの仕組み Goならわかるシステムプログラミング 英語 中国語 Toeic900超えるまで止める予定 compiler book Effective …
はじめに ある日、特定の研究室サーバーに対してSSH接続できなくなったことがありました。このような問題は今回が初めてではなく、似たような事例が発生しては「面倒なので再起動する」という対応を取っていました。 一方、少しでも手掛かりがあるならば根本的に問題を解決してみたいと以前から考えていました*1。 本記事では、監視の定番であるPrometheus・Grafana・Alertmanagerを導入する方法を紹介します。いずれも私が以前所属していた研究室で導入した経験があるため、Getting Startedというよりは導入の改善に焦点を当てたいと思います。 構築する監視基盤のアーキテクチャ 1. …
自己紹介 エンジニアとしての経験は約25年になります。最初の10年ほどはSIer業界でWindows系や.NET系の開発を専門にしておりましたが、最近15年ほどはWeb業界の自社開発企業界隈でLinux系のバックエンド開発およびクラウドインフラ周りの設計/構築業務に携わっております。 ここ数年はクラウドのインフラエンジニアとしてサービスの新規開発フェーズやインフラのリプレイスフェーズに参画させていただくことが多いです。最近の業務経験に関しては下記のレジュメにまとめておりますのでご参照いただければと思います。 github.com エンジニアとしての抽象的な強みは下記になります。 幅広い知見と経…
ITP2(合計:47h 今月:19h) プログラミング HCW(合計:54h 今月:13h) ニューラルネットワークって何的なやつとか DM(合計:86h 今月:26h) 二項定理とか CM と内容が結構被ってきてよくわからん ADS1(合計:51h 今月:11h) 複雑性クラスの話ぜんぜん理解してなかったのでよかった これからやること AWS入門する ECS Webエンジニアが知っておきたいインフラの基 入門監視 クリーンアーキテクチャ 実践ハイパフォーマンスMySQL 第3版 プログラミングコンテスト攻略のためのアルゴリズムとデータ構造 停滞気味 Linuxの仕組み Goならわかるシステム…
はじめまして、7月1日にSREとして入社しました霜鳥です。 よく「きりしま」と読み間違えられるのであえて平仮名で表記しています。 前職ではバイトルで知られているディップ株式会社で看護師向けの人材紹介事業「ナースではたらこ」のエンジニア/テックリードとして保守・開発・運用を行っていました。 前職・ディップでのお仕事 京都大学工学部卒業後、2019年に前職のディップにRuby on Railsを扱うバックエンドエンジニアとして入社し、DTダイナミクス(ミスミ)に転職するまでの丸5年間、1つのサービスのグロースに携わってきました。 入社当初のチームは自分を含めて3人のとてもコンパクトなものだったため…
ITP2(合計:28h 今月:13h) midterm だした HCW(合計:41h 今月:17h) midterm だした DM(合計:60h 今月:20h) midterm だした ADS1(合計:40h 今月:25h) midterm だした これからやること AWS入門する ECS Webエンジニアが知っておきたいインフラの基 入門監視 クリーンアーキテクチャ 実践ハイパフォーマンスMySQL 第3版 プログラミングコンテスト攻略のためのアルゴリズムとデータ構造 停滞気味 Linuxの仕組み Goならわかるシステムプログラミング 英語 中国語 Toeic900超えるまで止める予定 co…
こんにちは、エンジニアの田中です。BIチームで主にデータパイプラインの構築やBIダッシュボードの作成を行っており、気づけば配属されて丸2年経ちました。 先日『入門 監視―モダンなモニタリングのためのデザインパターン』(Mike Julian著, 松浦 隼人訳, オライリー・ジャパン)を読みましたのでまとめます。 本記事はFLINTERS BASEブログ祭りの一環として書いたものです。テーマは #技術書 #監視 #読書メモ です。
ITP2(合計:15h 今月:6h) 仕事って感じ HCW(合計:24h 今月:9h) 割と知らん要素がでてきたのでちょっと面白くなってきた DM(合計:40h 今月:18h) 基本情報 ADS1(合計:15h 今月:7h) う〜ん? 大阪セミナーいった fidoalliance.org これからやること AWS入門する ECS Webエンジニアが知っておきたいインフラの基 入門監視 クリーンアーキテクチャ 実践ハイパフォーマンスMySQL 第3版 プログラミングコンテスト攻略のためのアルゴリズムとデータ構造 停滞気味 Linuxの仕組み Goならわかるシステムプログラミング 英語 中国語 T…
こんにちは。FLINTERSでデータエンジニアをしている栗原です。今回の投稿はFLINTERSブログ祭りの記事です。テーマは#監視 #通知 #読書感想 です。 背景 私が参加しているプロジェクトでは、以下の監視業務に多くの時間を取られていました。 確認したいこと 日々APIやGA4タグ等からデータを取得 -> DBに保存のようなシステムにおいて、データが過不足なく正常にDBに取り込まれていること 初期確認体制 システムのワークフローが正常に動いたかどうかをメールで毎日通知 たまにDBへのクエリを実行し、取り込み件数を手動で確認する 徐々にこれらの体制を改善し、現時点では初期と比べて大幅に監視に…
『入門 監視』を読み終わったので、感想を簡単に書きます 入門 監視 ―モダンなモニタリングのためのデザインパターン作者:Mike JulianオライリージャパンAmazon 動機 新しいシステムをリリースするにあたって、モニタリングやアラート周りの設定が必要となったが、ベストプラクティスや周辺知識が少ない状態だった。特に、false positive なアラートを最初に設定してしまい、システム運用とともに徐々に改善してきた。こういった自分の場当たり的な対応ではなく、体型的に監視の知識を得たいと思い、今回はこの本を手に取った。 印象に残ったところ 有名企業は彼らが作ったツールによって成功したので…
ITP2(合計:9h 今月:9h) まあ HCW(合計:15h 今月:15h) なつかしいかんじ DM(合計:22h 今月:22h) まあ ADS1(合計:8h 今月:8h) う〜ん? compilerbook せっかくなら Arm で動かしたいなと思って書き始めたが授業が始まったので停滞 GitHub - inabajunmr/c これからやること AWS入門する ECS Webエンジニアが知っておきたいインフラの基 入門監視 クリーンアーキテクチャ 実践ハイパフォーマンスMySQL 第3版 プログラミングコンテスト攻略のためのアルゴリズムとデータ構造 停滞気味 Linuxの仕組み Goなら…
DevOpsに興味が出た DevOpsに興味が出た。というか、DevOpsエンジニアとして舵を切っていこうかなと思っている。理由は以下。 - 機能の変更や、機能の追加のリードタイムを減らしたい。 現在、受託開発をしているが、機能の変更や追加の相談を受けて、見積もりを出した時に、工数の兼ね合いで、発注に至らないケースが多い。 会社としても損失だし、エンジニアとしてより良いものを作りたいと思っているので、システムを良くしていくようにできないのは歯がゆい。 機能の変更や追加を容易にできるようにすることで、三方よしになるのではないか? ・自社:発注を受けて売上アップ ・取引先:システムが良くなることで…
ITP1(合計:67h 今月:1h) final の課題をちょろっと手直しして提出 CM1(合計:149h 今月:8h) final やった 結構疲れた まあまあできたと思う compilerbook x86 の環境用意してコード書くのがなんかやる気でなかったのでとりあえず step15 までがーーっと読んだ https://www.sigbus.info/compilerbook 結果書かないとわからん、になったのでゆっくりと書きはじめた GitHub - inabajunmr/c Arm64 のアセンブリを学ぶのにちょっとだけアセンブリを実行してレジスタを眺める、みたいのをどうしたらいいの…
概要 データベースリライアビリティエンジニアリングを読みました。 感想を書きます。 データベースリライアビリティエンジニアリング ―回復力のあるデータベースシステムの設計と運用作者:Laine Campbell,Charity MajorsオライリージャパンAmazon 概要 前提 目的 事前知識 読了時間 感想 次に関連で勉強すること 前提 目的 本書を読んだ理由は以下です。 2024年1月〜3月の目標の目標の注力分野の 1 つに SRE・DevOps を掲げていた データベースリライアビリティエンジニアリングは SRE を学ぶための書籍の 1 つとして挙げていた 事前知識 業務で SRE …