Sunday, 9 May 2010

Hadoop 読み会

ちょっと昨日飲みすぎだったみたいなんですが、まだ午前中の方が元気だった。Gusto の飯がまずくて、食べる気がせず、そのまま午後に突入したので、最後の方が気力が尽きてました。(ひどい)

でも、今まで読んだデータベースの中では一番まともだったんじゃなかろうか? On memory なファイルシステムと、マルチスレッド/分散なRPCの組合せで、きれいに書いてあります。

去年mySQL(C++)、一昨年 PostgreSQL(C) と、だめだめなソースを読んだからな〜

でも、Hadoop の大半はエラー処理雫と思うので、そのあたりを読もうとすると大変だろうと思います。

午後から、Map Reduce 読もうとしたら、TaskTracker/JobTracker がEclispse で動かないとか、DataNode/NameNode の方も見なきゃ行けないとか、RPC以外ににも、なんか通信があるらしいとか、まぁ、わけわからないところに突入して行ったので「やめようよ〜」を連発してました。すみません。

予習していれば楽勝だったと思う。特に、RPC される method 一覧があれば簡単。それは log 取りゃ良いだけだし。RPCとかをスキップすれば非常に簡単なプログラムなようです。こういうプログラミングは素晴しい。

ちょっと準備不足だったな。Eclipse 上で閉じて、Map Reduce 出来るところまで持って行っていれば良かった。普通は、何回か準備してから「じゃぁ、3日で読む」になるんですが、少し、焦りすぎたか。後悔後をたたず。

Cassandara も読もうと思ったようだが、Hadoop に時間かけすぎた。ま、そのうちね。

Ustream にも流したんですが、音声をだとダメかな。Eclipse のキャプチャ画像を全部取っておいてt、それに(おそらくはTwitter経由かなんかで)コメントを付けると言う方式が良さそう。

これで授業が一つ片付いたので、うれしいです。

No comments: