【 原始的なアクティブ・サイト調査法よりも一歩進んだパッシブ・アクセス解析法から一体何がわかるのか?ネットは匿名ではない。---新しい会社の研究動向調査方法 について】

作成日 2009/02/20

IT革命 推定処理


 


最新の方法は、こちらをご覧ください。

記載日 2013/02/05

                                                                                                written by Tomoaki Ueda  (上田智章)    掲載日 /2009/02/20/
【問題提起】

 25年以上前から行われてきた「ハッキング」という原始的な産業スパイ方法は良く知られていますが、当然違法であるだけでなく、知りえる情報精度にも限界があるのです。本稿では、数年前から模索・研究している情報提供サイトを使った完全パッシブ調査方法についてご紹介いたします。
 
【きっかけ】
 私は生物の情報処理(スーパーセンス:昆虫の複眼処理、イルカ、鮫等の感覚等)に関心を持って研究をしてまいりました。中でも推定処理(悟り)に最も関心を持ち研究を続けています。最近、「ネットは匿名だ。」「何をやってもわからないだろう。」と思っている人がとても多いように思います。例えば、仕事上の問題解決のために個人的関心を装って技術質問を匿名メールで送付してくるモラルのない人たちも増えているようです。この人たちは、自分が何者であるか知られたくないし、わからないだろうと思っているのです。本当にそうでしょうか?
 サイト運営の制約下でパッシブ(受け身)的な調査だけで何がわかるのかについて挑戦してみたところ判明した事柄についてご紹介いたします。
 
【図1】


 
【サイト運営におけるパッシブ調査の基本アルゴリズム】
 Neo-Tech-Lab.comはご存じのように電子技術関連の技術情報を無償提供するサイトです。と同時に、私が興味を持ったことを実験するためのサイトでもあります。現時点でのサイトにアクセスをしてくださる、あるいはくださったユーザーは約1万人程度。日本人口から見て1/10000以下と極めて少数です。つまり、地図上のユーザー人口密度は極めて低いのです。
 どうしても首都圏は技術者人口が多く、人口密度は高いのですが、つまりその分、地方は人口密度が低く、特定しやすいはずではないかと考えました。
 図1を見てください。
  仮定1:同一人物の技術的関心事は会社からの検索だけでなく、自宅からの検索にも反映され、同じサイトを閲覧するはずである。
  仮定2:自宅と職場までの距離は30km以内を仮定すれば十分であろう。
  仮定3:同一人物のサイト内アクセスページには個性が反映される。(アクセスするページ等、詳しくは内緒。)
 そして、ウェブ・サイト公開のために使うApacheサーバーはログを取ることができます。
 ログには、アクセス時刻IPアドレスアクセスしたページやデータ、検索エンジン経由である場合には検索キーワード等を記録することができます。
 現在、初めてのユーザーは殆ど検索エンジン経由で訪問されます。

 IPアドレスは逆引きでドメイン名やドメインを所有する団体名等の情報を得ることができます。
 従って、大多数の大企業や研究機関等はこの時点で、所属、場合によっては部署名までも判明します。
 極めて特殊な例ですが、英国ロンドン・ナノテク研究拠点(LCN:London Centre for Nanotechnology)の例のように、研究者の個人名まで特定することができるケースもあります。(この件は本人らに直接言及しておいたのですが、そのままのようですね。)

 自宅からのアクセスの場合は、以前はADSLなど回線を利用したアクセス・ポイント経由が多かったのですが、最近はブロードバンド化を反映して光ファイバーによるアクセス管轄地域が明解なプロバイダーが増えています。IPアドレスを逆引きすることにより管轄地域の略称(長野:ngn, 神奈川:kng等)が判明します。

 つまり、同一情報に最近関心を持っている、近い地域の人物を絞りこむだけでマッチングが可能なのです。
 自宅からのIPアドレスは接続のたびに変化する場合もありますが、検索エンジンで関心を持たれている「技術キーワード」を検索すると、その人のホームページや連絡先等が判明することもあります。

 会社で所属部署までしかわからなくても、検索エンジンで関心を持たれている「技術キーワード」に関係するグループ名や特許検索から発明者の氏名も判明するので、グループ構成等も判明します。また、特許検索結果から過去の研究動向がわかり、そこから類推することで所属グループの現行プロジェクトが判明する場合があります。技術質問には多分にその場合に抱えておられる問題点が含まれていると考えるのが妥当でしょう。

 さて、このようにして過去、数名の匿名メール(YahooやGmail等)の質問に対して、会社に直接メールでご返事を差し上げたケースが数件ございます。(当然、ご本人は会社のメールアドレス なんか書かれてないし、名前さえも書かれていなかった場合もありました。) 
そのようなケースでは、メールの中でちゃんと推定根拠の概略説明も行っております。いきなりだと驚かれるでしょうからね。
(現在はいちいち探偵ごっこで遊んで楽しんでいる暇はなくなりましたのでこのようなことはもうしていませんが。第一、飽きてしまいました。)
 
【まとめ】
 非合法な調査を行わなくとも、企業や研究機関で推進している研究の動向を完全パッシブに調査する方法についてご紹介いたしました。
 この調査はサイトの規模が大きくなるにつれて容易、かつ高精度、高範囲に行うことが可能です。
 しかも、活発な研究を行っているところの方が活発なアクセスをするようです。
 アクティブに無償情報を発信することで、逆に情報が終結する結果となるのです。
 しかも完全パッシブな調査方法のため違法性は全くありません。
 どっかの国のようにメール傍受(なんとこれは合法だと数名から聞かされました。)などしなくても良いのです。
 以上により、ウキペディアやどっかのサイトの質問コーナー等の方が当サイトよりも高効率にユーザーの産業活動を調査することが可能であると断言することができます。そういうサイトで気軽に質問をしている人は 今後気を付けた方が良いと思います。 

【解析事例】







【備考】
以下のように無料でIPアドレスでGoogle地図上の座標(緯度、経度)を検索することができるサイトが山の様にあるのですが、
このページのHTMLソースを解析すれば、Google Maps APIを使っている関係上、point=new GLatLng(35,135.75);とか
map.setCenter(new GLatLng(36.6833, 137.2167), 5);のように記述されていることがわかると思います。
つまり、『GLatLng(』から『)』までのはさまれた部分の文字情報を抽出すれば、簡単に地図上の座標を読込むことができます。
但し、参照するサイトによってプロバイダー所在地までしかわからないデータベースもあるので、複数のサイトを使って座標を求め、
多数決を取るとか、プロバイダー座標を除外するとかの処理を挟む必要があります。

●http://www.ip-adress.com/
【使い方】このサイトはAPIでIPアドレスを指定してアクセスできます。
但し、無料アクセスは1日に3回まで。アカウント登録すれば1日25回まで無料。
例:http://www.ip-adress.com/ip_tracer/202.215.26.52

●http://geotool.servehttp.com"
このサイト(http://geotool.servehttp.com)は勝手にリダイレクトされるようになったのでリンクを外します。
ウィルス等の危険があるかもしれません。




●http://geomaplookup.net/
【使い方】このサイトはAPIでIPアドレスを指定してアクセスできます。
例:http://geomaplookup.net/?ip=202.215.26.52


【実際のプログラム作成の為のヒント】
例えば、Excel VBAでは以下のルーチンを使う事で任意のURLからHTMLテキスト情報を簡単に読込むことができます。

本文中
Public Const URL As String = "http://www.ip-adress.com/ip_tracer/"
Public IPaddress As String ' 調査対象のIPアドレス
Public HTMLBuf As String ' HTML

   
   HTMLBuf = GetHTMLSource(URL & IPaddress)


Private Function GetHTMLSource(targetURI) As String
   Const cReTry As Long = 5
   Dim nReTry As Long

   nReTry = 0
   Set http = CreateObject("MSXML2.XMLHTTP")
LR: nReTry = nReTry + 1
   If nReTry >= cReTry Then
      GetHTMLSource = "NG"
      GoTo LB
   End If
   On Error Resume Next
   http.Open "GET", targetURI, False
   http.send
   If http.Status <> 200 Then GoTo LR
   GetHTMLSource = http.ResponseText '【UTF-8 Format】
LB:
   Set http = Nothing
End Function

なかのひと

【参考】
偶然、検索中に見つけたブログ用解析ツール『なかのひと』。
IPアドレスを基に組織に特化して地図情報表示をするところが、『Miku』や『悟り』そっくりだ。
ドメイン名も参考にして緯度・経度を高精度に割り出すとの記述がある。まるっきり『悟り』のアルゴリズムと同じようだ。
ふーん。いろいろありますねぇ。