ブログトップ 記事一覧 ログイン 無料ブログ開設

@sugamasao.blog.title # => ”コードで世界を変えたい” このページをアンテナに追加 RSSフィード Twitter

1970 | 01 | 02 | 03 |
2004 | 11 | 12 |
2005 | 01 | 02 | 03 | 04 | 05 | 06 | 07 | 08 | 09 | 10 | 11 | 12 |
2006 | 01 | 02 | 03 | 04 | 05 | 06 | 07 | 08 | 09 | 10 | 11 | 12 |
2007 | 01 | 02 | 03 | 04 | 05 | 06 | 07 | 08 | 09 | 10 | 11 | 12 |
2008 | 01 | 02 | 03 | 04 | 05 | 06 | 07 | 08 | 09 | 10 | 11 | 12 |
2009 | 01 | 02 | 03 | 04 | 05 | 06 | 07 | 08 | 09 | 10 | 11 | 12 |
2010 | 01 | 02 | 03 | 04 | 05 | 06 | 07 | 08 | 09 | 10 | 11 | 12 |
2011 | 01 | 02 | 04 | 05 | 06 | 07 | 09 | 10 | 11 | 12 |
2012 | 01 | 02 |

2008-12-07

[]インフラエンジニア討論会に行ってきました

初めに

運用・監視ツールはあまり知らない領域だったので初めて聞く名前が多数(せいぜいNagiosくらい)で、ちょっとメモが付いていけなかった。というか、普通にメモをするのが追いつかなかったので、間違っている部分があると思います。間違いがあればご指摘下さい。

ふだん、運用はさっぱり業務外なアプリ開発の人間ですが、参加してきました。

自分が作ったシステムを運用するのは、自分でだってできるようになりたいじゃん。っていうのが動機。

パネラー自己紹介

パネルディスカッション

  • インフラエンジニアの定義とは
  • 大規模サイトの運用 スケールアップ・スケールアウト
    • mixiでは10名程度で運用を行っている
      • サービスインした直後はアクセス数が多くなるので、余剰のサーバを追加して耐えられるようにしておく
        • アクセスが落ちつてきたらサーバを減らしていく
      • 1月1日の0:00はとてもアクセスが多くなるので対策が必要。
    • 楽天では・・・
      • サービスを「停止させるな」が基本ポリシー
        • とにかく落とさない
        • ひと月20分の停止時間を目標とする(計画停止を覗く)
      • 手順や作業内容のレビューは必須
      • 数十人体制で運用を行う
      • テレビ対応
        • あるある大辞典」とかで商品が紹介されると一気にアクセスが増える
        • topとかで見てるとアクセスの延びがわかるwww
    • ペパボでは
    • インフラエンジニアを実感した瞬間
    • 一流、二流の違いとは
    • 宮下さん
      • なるべくrootにならない
      • 起動したら必要な作業は終わっている、障害があってもある程度自動で復旧できるような仕組みを作っていく
      • 業務時間外にUnix勉強会を開催してりして、ディレクター等にも来てもらって興味を持ってもらう
      • サービスやサーバが停止したら「ほっとけば良いじゃん」とは思えない性分
    • オススメ運用管理ツール
      • OSSが多い
      • NAGIOSを使ってるよ
        • 設定が面倒だけど・・・
        • 見た目はとても良い
      • Hobit
        • 小規模向けだけど、簡単に導入できる
    • 楽天の台湾でのシステムについて
      • ザビックス(綴りがわからん)
        • 設定は大変だけど、そこそこ使える
        • aptで入れられる
      • Monit(プロセス監視)
        • プロセスが落ちたら起動
    • mixi
    • ペパボ
    • Archer
      • SVNからパペットサーバへパペットの定義ファイルを取得して、各サーバへパペット定義を実行していく
      • 野良スクリプトの管理ってどーする(和田さん)
      • できるだけ、野良は作らないようにする。必要であればSVNで管理して野良スクリプトは出来る限り管理するようにする(宮下さん)
  • 気になるあのサービス(使ってるサービス等)
  • 会場から質問:クラウドコンピューティング仮想化は今後増えていく?(会場からのid:malaみたいな人の質問)
    • 増えると思う(和田さん)
    • 仮想化で運用コストは減らせる
    • 少人数で対応できるようになる
    • 少数のエキスパートと数人の”そこそこのエンジニア”でやっていけるような感じになるのではないだろうか
  • ワークスタイルの勘所 インフラエンジニアの働き方とは?(一言で)
    • 宮下さん:楽
      • 良い意味で、いかに手を抜いて運用できるか、楽にできるようになるか
      • 後で楽をするために最初の苦労をいとわない
      • 大変だけど、そこを楽しめるような人物が重要
    • 石原さん:ネットワークの酸素

(ここから電源不足になり記載できずorz

総括

個人的には、もう少し運用・監視ツールをどうやって使っているかと言ったところを深く掘り下げてほしかったなーと思ったりしたのだけど、インフラエンジニアという括りで話にはちょっと細かい所に入りすぎてしまうか。。。

あと、インフラエンジニアの給与等の評価についてどのように取り組んでいるのか? という質問が会場から上がっていたのだけど、やはりみなさん苦労しているようだった。確かに、何か作業が発生したとき(=トラブル発生時)の方が給料が良いというのはなんとなく間違っている気がするのだけど、簡単な定量化は難しい。アプリ開発だって、創意工夫して8Hで仕事を終わらせる人とダラダラ10H仕事している人で、残業代の分だけ損するのはどーなのよ? ってのはあるし。。。

あと、おそらく「落とせない」サービスだとどこでもそうなのだろうけど、「徹底した手順化」をして、誰でも出来る反面、それ以外はやらないという作業になりがちで、そうなってしまうと個人の技量を発揮する場面もなくなってしまうんですよね(手順外の事をやった方がおこられちゃう)。そうなってしまうと、作業者のモチベーション的にも上がらないし、評価も上がりにくくなるんじゃないかな。

今回のイベントは普段、あまり接する事の無い世界に触れる事が出来て、色々と刺激になりました。

もし運用・監視系ツールに特化したLTとか勉強会とかあったら、参加してみたいですね><

スパム対策のためのダミーです。もし見えても何も入力しないでください
ゲスト


画像認証