Moni yllättyy siitä, kuinka paljon tietoa itsestä tai yrityksestä löytyy jo pelkällä Google-haulla: vanhoja PDF-liitteitä, yhteystietoja, kuvia, asiakaskeissejä, rekryilmoituksia tai välimuistiin jääneitä sivuja. Kun tiedät mitä hakukoneista ja julkisista lähteistä näkyy, voit myös paremmin rajata näkyvyyttä, korjata vanhentunutta tietoa ja vähentää turhia tietoturvariskejä.
Näitä “tarkennettuja hakuja” kutsutaan usein nimellä “Google Dorking”. Se tarkoittaa käytännössä hakukoneiden normaaleja suodattimia, joilla voi etsiä julkisesti saatavilla olevia tiedostoja tai sivuja.
Jos haluat tarkistaa erikseen, löytyykö netistä puhelinnumerosi tai kotiverkon julkinen IP-osoite, käsittelen niitä tarkemmin tulevissa "Tarkista näkyykö kotiverkon julkinen IP netissä"- ja "Salasanat kuntoon"-artikkeleissa.
| Komento | Mitä se tekee | Milloin käytetään | Esimerkki |
|---|---|---|---|
site: | Rajaa haun yhteen domainiin tai alidomainiin | Kun haluaa nähdä, mitä sivustostasi on indeksissä | site:omayritys.fisite:drive.google.com "omayritys.fi"site:docs.google.com "omayritys.fi" |
site: + lainausmerkit | Etsii täsmäfraasin tietyltä sivustolta | Kun etsii yrityksen nimeä tietyssä palvelussa (esim. LinkedIn) | site:linkedin.com "Yrityksen Nimi"site:docs.google.com "Yrityksen Nimi"site:drive.google.com "Yrityksen Nimi" |
filetype: | Hakee tiettyjä tiedostotyyppejä (PDF, docx jne.) | Kun etsii unohtuneita liitteitä / dokumentteja | site:omayritys.fi (filetype:xlsx OR filetype:docx OR filetype:pptx OR filetype:csv OR filetype:sql OR filetype:zip) |
intitle: | Sana täytyy olla sivun otsikossa | Kun etsii tiettyä sivua tai dokumenttityyppiä | site:omayritys.fi intitle:tarjous |
inurl: | Sana täytyy löytyä URL-osoitteesta | Kun etsii tietyn kansion sisällä olevia sivuja | site:omayritys.fi inurl:uploads |
intext: | Sana täytyy löytyä sivun tekstistä | Kun etsii sisältöä (hinnat, asiakkaat, sopimus, luonnos) | site:omayritys.fi intext:hinnasto |
"..." | Täsmähaku: hakee täsmälleen annetun fraasin | Kun haluaa löytää tarkan nimen, lauseen tai sähköpostin | "Yrityksen Nimi Oy" |
- (miinus) | Poissulkee sanan/fraasin | Kun tuloksia tulee liikaa tai haluaa rajata pois esim. rekryn | site:omayritys.fi filetype:pdf -rekry |
OR | Jompikumpi ehdoista (käytä isoilla kirjaimilla) | Kun nimi kirjoitetaan monella tavalla | "Yrityksen Nimi" OR "YrityksenNimi" |
before: | Rajaa tulokset ennen tiettyä päivää (YYYY-MM-DD) | Kun haluaa löytää vanhempia juttuja / liitteitä | site:omayritys.fi filetype:pdf before:2025-04-10 |
after: | Rajaa tulokset jälkeen tietyn päivän (YYYY-MM-DD) | Kun haluaa nähdä, mitä uutta on ilmestynyt | site:omayritys.fi after:2025-04-10 |
cache: | Näyttää hakukoneen välimuistiversion sivusta (jos saatavilla) | Kun epäilee, että vanha versio näkyy vielä | cache:https://omayritys.fi/sivu |
* (jokerimerkki) | Korvaa “mikä tahansa sana” -kohdan | Kun muistaa lauseen vain osittain | "Yrityksen Nimi" * "hinnasto" |
() ryhmittely | Ryhmittelee ehtoja loogisesti | Kun tekee monimutkaisempia hakuja | site:omayritys.fi (filetype:pdf OR filetype:docx) |
.. (numeroväli) | Rajaa numeroalueen (esim. hinnat/vuodet) | Kun etsii vuosia tai hinta-alueita | site:omayritys.fi 2022..2024 |
Kokeile useampaa hakukonetta
Kaikissa hakukoneissa ei välttämättä toimi kaikki yllä olevat komennot, mutta site, filetype, intitle, inurl ja lainausmerkit, miinus, sekä OR toimivat yleisimmistä. Kannattaa etsiä ainakin näillä hakukoneilla:
- Google – usein eniten osumia.
- Bing – löytää joskus eri asioita kuin Google
- DuckDuckGo – hakee perinteiset hakutulokset pääosin Bingin indeksistä, ja täydentää niitä omalla DuckDuckBot-hakurobotilla
Mitä tehdä, jos löytää jotain “ylimääräistä”?
Muista: vaikka poistaisit tiedon sivustolta, se ei välttämättä tarkoita, että tieto on “poissa internetistä”. Jos sisältö on ollut julkisesti saatavilla jonkun aikaa, se on voinut päätyä bottien keräämiksi, hakukoneiden välimuisteihin tai verkkosisältöä arkistoiviin palveluihin. Siksi pelkkä poistaminen ei välttämättä riitä. Käytännössä tämä tarkoittaa, jos arkaluontoista tietoa on ollut julkisesti näkyvillä, kannattaa toimia kuin se olisi jo vuotanut rikollisille.
Toimet aina riippuvat siitä mitä on vuotanut, mistä ja miten vuoto on tapahtunut ja miten kauan sitten vuoto tapahtunut, mutta tässä on yleispätevät toimet.
- Poista/rajaa sisältö lähteestä (sivu/liite pois, pääsy kirjautumisen taakse, oikeudet kuntoon).
- Pyydä hakukoneita päivittämään tulokset
- Jos käytät työkaluja, näistä on apua:
- Näiden kautta voi tarkistaa indeksoituja sivuja ja pyytää indeksointia uudelleen tai poistopyyntöjä (riippuen tilanteesta).
- Jos et käytä työkaluja, muutos päivittyy usein ajan kanssa, mutta voi kestää.
- Älä “piilota” arkaluontoista robots.txt:llä. Se on julkinen tiedosto, joten siihen ei pidä “piilottaa” mitään arkaluontoista, koska kaikki botit eivät noudata sitä eikä se estä pääsyä sisältöön ja jopa voi toimia ”vinkkilistana” rikolliselle. Lisää robots.txt-tiedostosta voit lukea blogissani tästä artikkelista.
- Vaihda salasanat ja (API)avaimet, jos riskinä on, että niihin on päästy käsiksi (ylläpito, sähköposti, CRM, hosting, integraatiot). Ota MFA käyttöön.
- Katkaise mahdollinen pääsyreitti: päivitä järjestelmä, sulje turhat käyttäjät, poista julkiset jakolinkit, vaihda API-avaimet, tarkista integraatiot.
Mikäli kyse on arkaluontoisesta tiedosta tai rikollisesta toiminnasta (tämä asia käsitellään lisää tietomurtoa käsittelevässä artikkelissa) niin muista säilytää todisteet: ota talteen mitä löytyi, mistä URL:sta, milloin havaitsit, ruutukaappaus, lokit (älä “siivoa” niin, että kaikki jälki häviää).
- Selvitä vähintään:
- mitä tietoja näkyi (nimi, sähköposti, osoite, tilaus-/laskutiedot, henkilötunnus, terveystieto, kirjautumistiedot jne.)
- montako henkilöä mahdollisesti koskee
- oliko tieto vain katsottavissa vai myös ladattavissa (esim. PDF-lista)
- kuinka pitkään se ehti olla näkyvissä (jos tiedossa)
Ilmoita Tietosuojavaltuutetun toimistolle, jos loukkauksesta voi aiheutua riski ihmisille (rekisteröityjen oikeuksille ja vapauksille). Ilmoitus on tehtävä ilman aiheetonta viivytystä ja mahdollisuuksien mukaan 72 tunnin kuluessa siitä, kun tulit loukkauksesta tietoiseksi. Jos asiakastietoja on ollut julkisesti näkyvissä tai ladattavissa, ilmoituskynnys täyttyy usein helposti, koska riski (esim. huijaukset, identiteettiväärinkäyttö, kiristys, mainehaitta) on todellinen.
Seuraavassa artikkelissa tarkistetaan, näkyykö kotiverkkosi julkinen IP-osoite netissä, mitä mahdolliset löydökset tarkoittavat käytännössä ja milloin on syytä reagoida.