シネスケとimdb

登録データ修正/778
http://csteam.pinehills.jp/index.php?%C5%D0%CF%BF%A5%C7%A1%BC%A5%BF%BD%A4%C0%B5%2F778
を見て思った。
imdbのデータ修正依頼の仕方について、日本語の解説を書いた方がいいかなぁ。
私自身もシステムを理解するのにかなり時間がかかったし、今でも判らないところが多いし。
世界には映画データベースがたくさんあるが、経験から言えば、まぁ1000本以上扱っていて誤りがゼロ件のデータベースはないはずだ。本などを除外してネットで誰でも利用できるものに限ると、その中でもIMDB(www.imdb.com)は特に英語圏についてはかなり精度が高く、量も多く、その他のローマ字語圏でもなかなかの精度。その他の言語はかなりお粗末だが、それでも、データ量は豊富で、日本映画ですら参考程度にはなる。
日本語の映画データベースとしては最大級のwww.allcinema.netは、日本語の大型データベースの中でも、データ精度はかなり低い方。量が命。何度か誤りをレポートしたことがあるがきりがないのでやめた。日本映画に限ってはwww.jmdb.ne.jpが最も信頼できるが、ここもたまに間違っている。ここは誤りのレポート先がわからない。わかったら是非レポートしたいくらいに価値のあるサイトなのだけれども。
で、goo映画他データベースはいくつもあるが、imdbだけは特に価値が高いし、データの出典として利用される頻度が非常に高いので、私はimdbだけは頻繁に修正リクエストを出している。ここは、どうやら「コミュニティサイト」らしく、誰でもレポートできるし、そのレポートを正確にするためにシステムも自動化されている。例えば、ある映画のクレジットにこの人がいたよとレポートするとき、「・・・というスペルの人は未登録ですが、スペルの似ているこの人ではありませんか」とか聞かれることもある。「・・・の人は脚本家としては登録ありますが、監督としては初めてだけれどいいですか」とか「・・・の人は脚本家としてはブランクが20年もありますが大丈夫ですか」とか。imdbの最大の欠点は、英語のデータベースだから仕方がないが、ローマ字語圏以外の人名表記ルールがめちゃちゃというところかな。なので、中国人とか日本人とかは、表記がばらばらで、探しにくいし、そのせいで、同一人物が表記違いでばらばらになることがよくある。unicode対応した人名表記データ項目があればいいのだけれども。。。