Google創業メンバーのSilverstein氏に聞く に書いてありました、「Google File System」(GFS)にインプットされる前にデータを単純化し、効率化するシステムMapReduceの論文がGoogle Labsから発表されています。
Google labs : MapReduce: Simplified Data Processing on Large Clusters
[ PDF ]
Googleのように巨大な分散システムを稼動させていくためには必要であり、もちろん今後も更に進化していくのでしょうね。。。
一応ですが、Google File Systemの論文は以前からあります。
The Google File System