Friday, 1 June 2012

ソースコード読み会最終日

3日で終わらなかったのは、これが初めて。要するに、

* 準備不足

なんだよね。

今週、Eclipse 上で Hadoop の Standalone を動かせるようにしてくれたので、スムーズに読めました。(最初からそうしろよ)

今回は、HDFS を読むということなんですが、

* DataNode
* NameNode

の二つがあって、inode とか directory は NameNode に。データは DataNode に。

その下に下請けスレッドが山ほど。で、Eclipse にスレッドが並びまくる。この中で、どこを止めれば良いのかがわからない。

いろいろ試行錯誤で。

クライアントからリクエスト受け取って、NameNode/DataNode で処理するところまでは読んだんですが、

NameNode の directory は、

* LinkedList<INode>

で、Colleciton.BinarySearch? え〜、そんなんで良いの? まぁ、計測してやっているので、それで良いなら、それで良いんだろうけどさ。

通信は、Protocol Buffer なのね。前に読んだ時は自前のRPCだったので、いろいろ変わってる。2年で全然違うってことか。そいういう世の中だよね。

DataNode の target の選択とかを読まないといけないのですが、そこまではいけませんでした。準備不足だったしな〜 
Post a Comment