Po několika minutách vyhledávání jsem došel k závěru, že žádná přímá cesta (rozumějme centrální databáze) neexistuje. Při googlování mě však napadla myšlenka "zneužít" k tomuto účelu některý z vyhledávačů. Pročetl jsem poměrně podrobně jejich „návody“ a začal tvořit kód. Základním prvkem se stal vyhledávač live.com, který umí prohledat svou databázi webových stránek podle jejich IP adresy. Z prohlížeče si to můžete vyzkoušet sami, pokud zadáte do adresní řádky řetězec
http://search.live.com/results.aspx?q=ip:
a za něj bez mezery IP adresu hledaného serveru. Výsledkem je seznam domén a odkazy na jejich nejnavštěvovanější stránky. Abychom však zjistili i veškeré subdomény k vyhledaným doménám podle IP adresy, je nutné, položit dalšímu vyhledávači ještě jeden dotaz. K tomuto účelu se mi více líbil google, který umí zobrazit veškeré stránky (a tím pádem i subdomény) v námi určené doméně. Opět si to můžeme ověřit v prohlížeči zadáním řetězce
http://www.google.cz/search?q=site:
za který doplníme název domény.
K programu jsem chtěl mít webový front-end a tak jsem ho celý vytvořil ve skriptovacím jazyku PHP. Nejdůležitější část programu tvoří funkce curl, která se dotazuje vyhledávačů na požadované domény (IP adresy). Dále jsem použil několik základních funkcí pro práci s řetězci (oříznutí textu, downcase písmen) a trojici regulárních výrazů pro úpravu odkazů. Výsledek si můžete prohlédnout na mých stránkách.
Uvedená metodika vyhledávání sice není zcela stoprocentní . Ve výstupu nenaleznete domény, které jsou aktivní teprve chvíli (tj. nejsou ještě zindexované vyhledávačem). Poskytovatel také může mít více serverů s několika IP adresami (kvůli rozložení zátěže) - v tomto případě je nutné provést vyhledávání pro každou IP adresu zvlášť a výsledky nakonec sečíst. Pro naši představivost je však dané vyhledávání zcela dostačující. Tak schválně – který český poskytovatel má na jedné IP adrese nejvíce domén? Já například nalezl na IP adrese 87.236.199.95 více jak 450 domén.