でも、今まで読んだデータベースの中では一番まともだったんじゃなかろうか? On memory なファイルシステムと、マルチスレッド/分散なRPCの組合せで、きれいに書いてあります。
去年mySQL(C++)、一昨年 PostgreSQL(C) と、だめだめなソースを読んだからな〜
でも、Hadoop の大半はエラー処理雫と思うので、そのあたりを読もうとすると大変だろうと思います。
午後から、Map Reduce 読もうとしたら、TaskTracker/JobTracker がEclispse で動かないとか、DataNode/NameNode の方も見なきゃ行けないとか、RPC以外ににも、なんか通信があるらしいとか、まぁ、わけわからないところに突入して行ったので「やめようよ〜」を連発してました。すみません。
予習していれば楽勝だったと思う。特に、RPC される method 一覧があれば簡単。それは log 取りゃ良いだけだし。RPCとかをスキップすれば非常に簡単なプログラムなようです。こういうプログラミングは素晴しい。
ちょっと準備不足だったな。Eclipse 上で閉じて、Map Reduce 出来るところまで持って行っていれば良かった。普通は、何回か準備してから「じゃぁ、3日で読む」になるんですが、少し、焦りすぎたか。後悔後をたたず。
Cassandara も読もうと思ったようだが、Hadoop に時間かけすぎた。ま、そのうちね。
Ustream にも流したんですが、音声をだとダメかな。Eclipse のキャプチャ画像を全部取っておいてt、それに(おそらくはTwitter経由かなんかで)コメントを付けると言う方式が良さそう。
これで授業が一つ片付いたので、うれしいです。
No comments:
Post a Comment