3日で終わらなかったのは、これが初めて。要するに、
* 準備不足
なんだよね。
今週、Eclipse 上で Hadoop の Standalone を動かせるようにしてくれたので、スムーズに読めました。(最初からそうしろよ)
今回は、HDFS を読むということなんですが、
* DataNode
* NameNode
の二つがあって、inode とか directory は NameNode に。データは DataNode に。
その下に下請けスレッドが山ほど。で、Eclipse にスレッドが並びまくる。この中で、どこを止めれば良いのかがわからない。
いろいろ試行錯誤で。
クライアントからリクエスト受け取って、NameNode/DataNode で処理するところまでは読んだんですが、
NameNode の directory は、
* LinkedList<INode>
で、Colleciton.BinarySearch? え〜、そんなんで良いの? まぁ、計測してやっているので、それで良いなら、それで良いんだろうけどさ。
通信は、Protocol Buffer なのね。前に読んだ時は自前のRPCだったので、いろいろ変わってる。2年で全然違うってことか。そいういう世の中だよね。
DataNode の target の選択とかを読まないといけないのですが、そこまではいけませんでした。準備不足だったしな〜
No comments:
Post a Comment