BLOGKID

Google取得のドメイン

　参考までにですが、GoogleはGogleとGooogleのドメインを取得しています。
　一時違いの入力ミスと真似などのブランドを守るためにしたのでしょうか？

Javaの RDF crawler （検索ロボット）

　Goodpicさんのページで、Javaの RDF crawler （検索ロボット）の記事を読みました。

WEB上をcrawlしてRDFを探しつつ情報をデーターベースに格納してくれる、Javaベースの検索ロボットだそうです。
　
An RDF crawler（Hackdiary）
　
アクセスログを見ると、このブログにもGoogleなどの大手の検索以外のクローラーが結構来ているようなのですが、XMLメタデータの活用方法を考えつつ、色々な検索ロボットを作っている人も多いのでしょうか？以前にJavaベースの検索ロボットを調べてJ-Spiderは結構よさそうだったのですが、RDFに特化したクローラーというのは色々と使えそうですね。

　そこで、Hackdiaryの方ですが、簡単に出来そうだったので試してみました。
　↓このプログラムのDataSourceとアカウントの自分の環境に合わせてReCompileだけで動作しました。
　src/com/hackdiary/foaf/scutter/Scutter.java
　ここを修正 → DBConnection dbcon = new DBConnection("jdbc:mysql://localhost/scutter", "scutter", "scutfoo");
　
　起動は付属のシェル（scutter.sh）にRDFなどのURLを引数として渡せば動作します。
例 )
# scutter.sh http://www.myblog.jp/blogs.rdf?type=rss1.0
2003-12-10 07:11:34.711 INFO [http://www.myblog.jp/blogs.rdf?type=rss1.0] com.hackdiary.foaf.scutter.Retriever - Retrieving
2003-12-10 07:11:39.305 INFO [http://www.myblog.jp/blogs.rdf?type=rss1.0] com.hackdiary.foaf.scutter.Retriever - Finished retrieving
2003-12-10 07:11:39.473 INFO [http://www.myblog.jp/blogs.rdf?type=rss1.0] com.hackdiary.foaf.scutter.Aggregator - Deleted 0 triples from http://www.myblog.jp/blogs.rdf?type=rss1.0
2003-12-10 07:11:55.955 INFO [http://www.myblog.jp/blogs.rdf?type=rss1.0] com.hackdiary.foaf.scutter.Aggregator - Added 820 triples to model (with provenance), now have 1340 triples.
　
　設定や検索情報などはＤＢの下記テーブルの様に作成されます。
　+---------------------------+
　| RDF_LAYOUT_INFO
　| RDF_LITERALS
　| RDF_MODELS
　| RDF_NAMESPACES
　| RDF_RESOURCES
　| RDF_STATEMENTS
　+---------------------------+
　
　この中で、参考までに　RDF_NAMESPACES を見てみた。
mysql> select * from RDF_NAMESPACES ;
+----+-----------------------------------------------------------------------------------------+
| ID | URI
+----+-----------------------------------------------------------------------------------------+
| 1 | http://www.myblog.jp/blogs.rdf?type=
| 2 | http://accessmx.web.infoseek.co.jp/
| 3 | http://news.2log.net/slows/archives/
| 4 | http://misc.2log.net/tabini000/archives/
| 5 | http://www.miryuna.net/greenblood/index.php?id=
| 6 | http://blog.nettribe.org/btblog.php?bid=
| 7 | http://www.myprofile.ne.jp/blog/archive/brain-tennis/
　
　きちんと動作しているようだ！
　
　時間があれば色々してみたいが、XMLをベースとしたセマンテックウェブの何か楽しい事が出来るような気がします。　しかしそのアイデアが、なかなかあるようで無いようで・・・

FINDING NEMO

　今日は都内で行われた、とあるセミナーの帰りに時間が出来たので同僚が絶賛していた、ファインディングニモを観てきました。
　本当は日本語吹き替え（木梨憲武さんと室井滋さん）を観たかったが行った映画館は午前中だけだったので、少し残念でしたが字幕版を観ました。　さて感想ですが、ストーリーは子供向けにという事もあり解りやすく楽しめ、映像は海の中と言う不規則な環境を非常に素晴らしく表現したPIXARの技術力と表現力に見入りました。
　この映画もお勧めなので、子供をつれて是非行ってみては如何でしょうか？（今日行った映画館には子供の座席を高くするシートもありました。）
　ところで、この間見たTHE LAST SAMURAIの映画館で、FINDING NEMOの宣伝の一環でニモの魚こと、カクレクマノミが水槽で泳いでいました！映画のストーリに照らし合わせると非常に微妙な感じがしますが・・・何か意図はあるのでしょうか？
　あと映像の中に、見覚えのあるキャラクターが・・・是非探してみて下さい！

仕事で使ってみたい技術

　前々から個人的に仕事で使ってみたい技術が２つあります。　１つはUDDI (Universal Description, Discovery and Integration) と、JXTAであります。　双方共になかなか仕事で経験する機会が無く、UDDIは仕事で提案しても知識力（説得力）の不足や規模やコストやスケジュールなどの問題で、どうしてもSOAPやWSDLで止まってしまうと言うのが現状でありますしJXTAなどはP2Pそのものの仕事をするチャンスが無いと言うのが現状ですが、機会があれば是非やってみたいものです。
　
　仕事でやらないと本気にならない性分ですがJXTAは正直なところ、もし仕事の機会があれば、のめり込みそうな感じがします。
　いつの間にか日本語訳の書籍もあったんですね！

　
　さてUDDIでノードを運営している有名企業ですが、Microsoft , IBM , NTT Communications , SAPがあります。これらは、UDDI.orgの仕様に準拠した実装をしており、我々や企業はこのサービスを参照してインターネット上のアプリケーションサービスを参照する事が出来ます。　今後はこれらの何れかのサービスへ接続する簡単なサンプルを掲載したいと思います。（あくまで予定です！）

見事に日本人の心を捉えたTHE LAST SAMURAI

　サイトの位置づけから違う記事になってしまいますが、たまには番外として・・・
　昨日、トム・クルーズ主演のTHE LAST SAMURAIを観てきました。　私は以前から、トム・クルーズのファンでしたが、ここ数作品の特に「VANILLA SKY」と「Minority Report」は個人的に良い印象ではなく、「このLAST SAMURAIもどうせ・・・」などと思いながら観てきましたが感想は・・・

　武士道や特に大半の日本人が忘れかけてもいる「わび」「さび」などを、海外の映画製作会社が見事に表現しており、また海外の映画製作会社などと言う事を忘れてしまうぐらいに、それらを物語を通じて再認識させられ、そして感動して泣ける映画です。

　もちろん海外の製作会社に１００％任せっきりではなく、ある日本の役者さんは積極的に良い作品にすべくセットなどに対しても、スタッフ兼アシスタントとして参加した方もいます。（パンフ参考！）
　
　タイトルにも書きましたが、”見事に日本人の心を捉えた、THE LAST SAMURAI”・・・私の今年一番のお勧めです。（私は年間に数十本の映画を観に行くほど、映画は好きです！）
　映画を見た後で、是非パンフも買ってみて下さい。　見た後の余韻とシンクロして楽しむことが出来ます。
　
　LAST SAMURAIの公式ページでは、12/18（木）までの間、オリジナルＴシャツの抽選キャンペーンがありますので・・・「名誉」「義」「忠」「勇」「礼」「仁」「誠」の文字が入った『ラストサムライ』オリジナルTシャツが欲しい方は抽選登録してみては如何でしょうか？

GoogleのJavaApplet

　以前、Ｊｅｆｆさんの”Googleのイースターエッグ”を思い出し、ちょっと遊んでみました。
　Easter game

　このウサギアプレットを作ったのは、Ken PerlinさんというＣＧの専門家でこの方のページを見たところ、下記のハートのアプレットを見つけました。
　my valentine
　
　２つとも古く２０００年のHoliday Logos にもありました・・・参考までに！

GoogleToolbarと社内開発環境

　最近仕事で、Web動的コンテンツのキャッシュ化対応調査（特にApacheやSquidなどのキャッシュを調査）でHTTPのヘッダー情報を解析している最中に、ふと気が付きましたがGoogleToolbarをインストールしているブラウザで社内のWeb開発環境サーバへアクセスすると、アクセスが成功した時に、PageRankの問い合わせをしていました。　無論PageRankはゼロですが、社内で利用しているURLのドメイン名だけがＧｏｏｇｌｅのサーバへ渡されています。
　開発環境にせよ、イントラ環境で使っているにせよ私個人的には、これらのＵＲＬは外に流れても基本的には問題ないと思いますが、気がついたので参考までに・・・

GoogleSynth

　会社の同僚に教えてもらいましたが、GoogleSynth っと言う、Googleの画像検索機能を使いランダムに２枚の画像を抜き出しそれを合成するツールです。
　使ってみましたが、なかなか楽しめるツールであるのと、このようなアイデアの発想にとても関心しました。

Google Tag Library

　JavaWorldの2004/1月号にGoogle Tag Library の記事があったので試してみた。
　まずは、Google Tag Library から Libraryをダウンロードし、　Google Web APIsのサイトで、 license keyの登録/取得が必要である。
　
　ダウンロードした、google-taglib-1.0.1.tar.gz のgoogle.jar と google.tld をWEB-INF/libなどへコピーする。

　web.xmlを下記のように設定し、（license keyは取得したモノを設定する）

<?xml version="1.0" encoding="ISO-8859-1"?>
<!DOCTYPE web-app
PUBLIC "-//Sun Microsystems, Inc.//DTD Web Application 2.2//EN"
"http://java.sun.com/j2ee/dtds/web-app_2_2.dtd">
<web-app>
<context-param>
<param-name>google_key</param-name>
<param-value>license key</param-value>
</context-param>
<taglib>
<taglib-uri>/google-taglib <taglib-location>/WEB-INF/lib/google.tld</taglib-location>
</taglib>
</web-app>

　入力フォームを下記のようにして、

<form target="_blank" action="results.jsp" >
<input type="text" name="q">
<input type="submit" >
</form>

　JSP（results.jsp)を下記のようにし、フォームから実行すれば動作します。

<%@ page contentType="text/html; charset=UTF-8"%>
<%@taglib uri="/google-taglib" prefix="google"%>
<google:search/>
<ol>
<google:searchResult>
<li><google:element name="title-url"/></li>
</google:searchResult>
</ol>

　
※サンプル

go.jpのサイト

　なんとなく、Googleで go.jpを検索してみたら検索結果の件数が、約5,230,000件だった。　そして参考までに co.jpを検索してみると、約9,850,000件だった。　co.jpのサイトが多いにせよ、go.jpは参考値ではあるが、それでも co.jpの半分とは・・・これらのサイトのシステム運用費やサイト更新の費用はいったいどれ位かかっているのか、非常に気になります。
　
--- 2003.12.5に、sfこと古谷俊一(創作者のための検索エンジン最適化:seo.cre.jp)さんに、ご指摘されたので訂正します。（コメントありがとうございました。）

ドメイン別に検索したい場合には、
site:go.jp go.jp
site:co.jp co.jp
とやることになります。

約2,620,000件
と
約8,900,000件
でした。