2010年9月アーカイブ

ほとんど見えなかった、トラブルですが
僕にとっての一番ボトルネックになっている部分
(金銭関連だと、別w)
は、光が見えてきました。


いろいろな人に感謝、今後の働きで、お返しできたらと思います
今日は、少し小休止し、明日から、全力で、頑張ります
今まで、ただ、ガムシャラに働いて、借金もしたし、なぜか、自分がデータセンターやり、結果、会社も建ててしまったのですが、ふと足下を見てみると、自分がやっていることが、ビジネスではなく、労働であることに、気づきました。

最小限の経費で、最大限の利益をうる、そこだけに集中し、自分の時間の切り売りで、何とか、ここまでやってきました。

しかし、この数ヶ月間のトラブルと、この半年、様々な、経験を通じて、今までのやり方の、限界を痛感しています。

あと、もう一点だけ変わったのが、お金に対しての考え方。

今までは、究極的に、最優先が、お金でしたが、トラブルや、年齢を重ねてきたからか、若干、そのあたりの、価値観が、変化してきました。



会社というか、ビジネスのグランドデザインとともに、人生のグランドデザインも、構築しなければ、と思っている今日この頃です。

決戦は、木曜日です。ここ如何では、相当、動きます。
頑張ります


ここ最近のトラブルを機に、データセンター業務を振り返ってみました。

自社内でのサーバー運用は、2002年頃から、開始なのですが
正式に、ユーザー様に利用してもらい始めたのが、2006年からです。

当社の場合、ほとんどオーダーメードの専用サーバー、もしくは、運用を委託されてのホスティングがほぼ9割以上という、特殊な環境です。
特殊な環境というのにふさわしく、alexaのランキング(日本)で3000番以内に、何サイトか、うちが管理するサイトがあったり、とにかく、負荷が高いサイトが多いのが特徴です。1サイトで月間9000万PV達成する様なサイトも存在します。

負荷が高いサイトが多いため、アプリの動作性能が、もろに出る場合が多く、特に、サーバーの性能が低かったときは、アプリ落ちが、悩みの種でした。

当社の場合、特に、トラブルが出る、お客様は決まっていて、パターンとしては、自社の運営しているサイト群の負荷が理解し切れてない、とか、アプリを運営者自身が、コントロールし切れてない場合に、よく発生します。

特に、静的WEBから動的なWEBサイトに移行期だったこともあり、皆さん、手探りで、アプローチしていたので、この部分は、こちらも、非常に、勉強になりました。

といのが、こういう、独自アプリを利用して、高負荷環境で回しているサーバー以外、サーバーって、落ちることが無く、良くも悪くも、上記の経験は、凄く役に立ちました。
サーバーは、トラブルや、落ちると言うことがあるというのは、頭で判っていても、実際に体験して見ないと、判りません。ある意味、あらゆるクレームを、言われたので、本当に経験になりました。

ちなみに、前述の月間9000万PVを超えるサイトは、2006年から運用しているのですが、ノーメンテ、ノートラブルで、今まで来ています。

で、そんなことを考えながら、大きいデータセンターのトラブルを振り返ってみました。

・外部DNSサーバーの回線落ち(1時間ほど)
・当時共用サーバー兼メインサーバーのオーバーフロー(30分ほど)
・客サーバーのHDトラブル(運用中のファイルシステムの故障、復旧3時間ほど)
・客サーバーのHWトラブル(再起動不可、復旧4時間ほど)
・メインブレーカー落ちのトラブル(原因不明、ブレーカー交換)
・UPSトラブル(雷が原因、UPS即落ち、1時間で復旧)
・UPSトラブル(過電流、40分ほどで復旧)
・共用サーバーの1台が過負荷(15分ほどで復旧)

と、意外に、少なかったんだなと、思いました。
この中でも、一番、ノイローゼになりそうだったのが、ブレーカーでした
ある日突然、ブレーカーが落ちるようになりました。
当時は、過電流ほども、電源使ってなかったのと、落ちるブレーカーの部分の構成はメイン(120A)の下にサブ(30A)の構成だったのですが、落ちるブレーカーは、メイン側、つまり、下流の過電流で、落ちているわけではなさそうなのです。
最初は、UPSのアラームで気付き、なぜか、理由は、判らなかったのですが、毎日、同じ時間に、ブレーカーが落ちるようになって、そこからは、かちっと言う音に、敏感に反応する様になりました。
結局、ブレーカー交換をしたのですが、メーカーに直送しても、理由は出ず、有耶無耶になったのですが、今でも、あの恐怖は、覚えています。


話は戻って、ほぼ、99.999%の稼働率は、達成しているのかなと、思いつつ、今後も、もっとシステマティックに、管理し、稼働率あげたり、トラブルを下げていきたいなと、考えています。

クラウドも良いのですが、CPU以外の部分で、高負荷だと、なかなか、安易に、クラウドで解決しましょうなどと、いえない場合が、多いので、僕らの存在する意義も、もっと、見つけていきたいです。

しかし、個人的に、お客様要因のトラブルで、電話かかる場合が(昼夜、曜日問わず^^;)、多かったので、もう少し、トラブルは、多かったと思っていたので、意外に、少ないんだなと、自分でも、驚いてしまいました。

とにかく、いろんな場面で対応できるように、これからも、精進するつもりです。
よろしくおねがいします






前回のブログ投稿直後、インシデント発生しました。



正直、相当、へこたれてます。
自分のミス、自分が、要因のことは、仕方ない、そういう生き方してきたので、そういう部分は、幾らでも耐えられるのですが、決定要因を、相手が握られている、今回のような、インシデントの連続では、少し、心が、折れそうになっております。

性悪説で人間と、接しないと、駄目と、理解していても、自分のチームの人には、性善説で、接してしまう、自分の不味さを、痛感した、今回でした。



ここ4,5年振り返ってみたのですが、結局、僕が求めるレベルと、時間軸、価値観が違いすぎたのが、理由だと判りました。
やっていることは、同じだったんですね。変えることが、出来ない、本質的な物が、変わると期待し、その上で、こちらのペースで、相手のペースを乱していた。

ただ、今回の流れで、一般的に言って、こちらが悪い部分は、何一つとしてないですが、いろいろな物が、人質に取られている以上、動けません。勉強になりました。

人は、変わらない、こういう、基本的な部分の見落とし、勝手に期待して、結局、自分にしっぺ返しを食らいました。
いつかは、公開して、いろいろな人に、意見を聞いてみたい案件です。


今一度、ビジネスの難しさと、人の難しさを、痛感した、この3ヶ月。
正直、ここまで続くと、相当、下向きにしか考えなくなってきているのですが、彼は、そんな先が見えないような状況を4年以上続け、さらにペースチェンジを求められたら、確かに、破綻するのも納得かも。

この数ヶ月、ほとんどビジネスとしては、成立しておりませんが、自分の人生の中では、相当考えささせられる期間になってしまいました。もっと楽にしなよ、といろいろな方に、応援して頂けるのは、幸いなのですが、迷いも出てきました。

しかし、良いお話も、色々頂いているのと、某会社も、必ず、形にさせたいと思っているので、悩むところ、多いですが、ここを乗り越えていきたいです。


2002年ゼロからスタートして、2008年、やっと方向が見え、ようやくスタートと思っていたのが、振り出しです。ただ、弱っているといえど、負ける気は、一切ありません。頑張ります


このアーカイブについて

このページには、2010年9月に書かれたブログ記事が新しい順に公開されています。

前のアーカイブは2010年8月です。

次のアーカイブは2010年10月です。

最近のコンテンツはインデックスページで見られます。過去に書かれたものはアーカイブのページで見られます。

Powered by Movable Type 4.29