SlideShare a Scribd company logo
@lewwwinSEMcamp
SEMcamp
BlackHat Analytics
Wprowadzenie. SkyNet. Przygotuj się!
Maciej Lewiński - @lewwwin
XV SEMCamp @ Warszawa
@lewwwinSEMcamp
UWAGA!
Przedstawione w niniejszej prezentacji
przykłady oraz techniki BlackHatu są
przytaczane tylko w celach edukacyjnych.
Autor niniejszej prezentacji nie bierze
odpowiedzialności za wcielenie omawianych
metod w życie.
@lewwwinSEMcamp
@lewwwinSEMcamp
Definicja BlackHat
@lewwwinSEMcamp
Podsumowanie ostatnich 15 SEMcampów ;)
BlackHat SEO
• ukryty tekst
• cloaking
• keyword stuffing
• automatyczne
generowanie treści
• SWL
• infekowanie linkami
• budowanie zaplecza
BlackHat PPC
• boty generujące
wyświetlenia
• wyklikiwanie budżetu
dziennego
• CTR Nuke
• ominięcie ograniczeń
znaków towarowych
• manipulowanie zawartością
stron docelowych
• ukrywanie reklam przed
konkurencją
@lewwwinSEMcamp
Dlaczego BlackHat Analytics?
Trend Automatyka Kasa
@lewwwinSEMcamp
Definicja BlackHat Analytics
Celowe działanie zakłócające, usuwające,
przechwytujące dane WA przy użyciu luk
technicznych lub prawnych; celem czerpania
zysków finansowych, lub uzyskania przewagi
konkurencyjnej.
Phil Pearce
@lewwwinSEMcamp
Nasze dane
@lewwwinSEMcamp
BlackHat Analytics
Zrozumied. Wykryd.
Zareagowad. Zapobiec.
@lewwwinSEMcamp
SEMcamp
Na czym opiera się analityka?
@lewwwinSEMcamp
Ciasteczkologia #1
1st party cookies 3rd party cookies
Jak się ich pozbyd?
Wyczyścid zawartośd przeglądarki ;)
@lewwwinSEMcamp
Czytanie z ciastek
<script type="text/javascript">
function readCookie(name) {
var nameEQ = name + "=";
var ca = document.cookie.split(';');
for(var i=0;i < ca.length;i++) {
var c = ca[i];
while (c.charAt(0)==' ') c = c.substring(1,c.length);
if (c.indexOf(nameEQ) == 0) return
c.substring(nameEQ.length,c.length);
} return null; }
function googleCookieReferrer()
{ var feed=readCookie("__utmz");
feed=feed.split("|");
feed=feed[0].split("=");
return feed[1];};
if (googleCookieReferrer() == "google")
{
document.location.href("http://www.akademiaanlytics.pl/pogoda/");}
</script>
@lewwwinSEMcamp
Ciasteczkologia #2
Flash cookies
Jak się ich pozbyd?
Windows XP
C:Documents and Settings[Twój Profil]Application DataMacromediaFlash Player#SharedObjects[Random Name][Web Site Path]
Windows 7/Vista
C:Users[Twój Profil]AppDataRoamingMacromediaFlash Player#SharedObjects[Random Name][Web Site Path]
MacOS
~/Library » Preferences » Macromedia » Flash Player » macromedia.com » support » flashplayer » sys
http://www.wired.com/2009/08/you-deleted-your-cookies-think-again/
@lewwwinSEMcamp
@lewwwinSEMcamp
Prawie Ciasteczkologia #3
EverCookie
Jak się go pozbyd?
Jakby to ująd? :)
http://samy.pl/evercookie/
@lewwwinSEMcamp
EverCookie w praktyce
http://samy.pl/evercookie/
@lewwwinSEMcamp
Coś więcej niż Ciasteczkologia #4
FingerPrint
Jak się go pozbyd?
Zmieo przeglądarkę
https://github.com/carlo/jquery-browser-fingerprint
@lewwwinSEMcamp
Ile % z UU to ludzie?
3304 / 4100 * 100% = 80%
Czyści ciacha? 
@lewwwinSEMcamp
Fingerprint, a UU
1745/1808 *100% = 96%
https://github.com/carlo/jquery-browser-fingerprint
@lewwwinSEMcamp
SEMcamp
Ograniczenia w Web Analytics
@lewwwinSEMcamp
Użytkownik jest najważniejszy
(not provided)
@lewwwinSEMcamp
#takabranża
@lewwwinSEMcamp
Modyfikacja klasycznego GATC
<script type="text/javascript">
var _gaq = _gaq || [];
_gaq.push(['_setAccount', 'UA-123456789-1']);
_gaq.push(['_trackPageview']);
(function() {
var ga = document.createElement('script'); ga.type = 'text/javascript'; ga.async = true;
ga.src = ('https:' == document.location.protocol ? 'https://' : 'http://') +
'stats.g.doubleclick.net/dc.js';
var s = document.getElementsByTagName('script')[0]; s.parentNode.insertBefore(ga, s);
})();
</script>
@lewwwinSEMcamp
Co muszę zrobić?
@lewwwinSEMcamp
Progi w GA
@lewwwinSEMcamp
Czego NIE mogę przechowywać w GA?
• Danych osobowych
• Adresów e-mail
• Numerów telefonów
• Adresów IP
oraz wszelkich pozostałych danych wrażliwych:
• Dokładna data urodzin
• Preferencje seksualne
• Upodobania polityczne
• Itp..
http://www.google.com/analytics/terms/us.html
@lewwwinSEMcamp
Konsekwencje
http://www.google.com/analytics/terms/us.html
@lewwwinSEMcamp
Przykład 1: celowe działanie
@lewwwinSEMcamp
Przykład 2: „przypadkowe” działanie
site:konkurent.pl inurl:”utm_content * gmail.com”
http://www.google.pl/#q=inurl:pl+inurl:utm_content+*+g
mail&pws=0&num=100&filter=0& as_qdr=all
www.twojadomena.pl
https://support.google.com/adwords/answer/8206?contact=1&rd=1#
lub
@lewwwinSEMcamp
Zabezpieczenie ;)
Wyklucz parametry:
email, mail
utm_source, utm_medium, utm_campaign,
utm_content, utm_keyword
lub
User-agent: *
Disallow: /*utm_medium=email
Disallow: /*gmail.com
Noarchive: /*utm_medium=email
Noarchive: /*gmail.com
@lewwwinSEMcamp
SEMcamp
3:>
Dane, dane, dane…
@lewwwinSEMcamp
Współczynnik konwersji
Cele/Transakcje
Sesje
100%.
Mogę popsud :)
Mogę popsud :)
@lewwwinSEMcamp
Przypadek 1: zaprzyjaźnieni porywacze :)
30% ruchu nie należy do mnie
@lewwwinSEMcamp
Zabezpieczenie :)
@lewwwinSEMcamp
Przykładowy podział konta GA
@lewwwinSEMcamp
Przypadek: 2 - Skynet
http://www.incapsula.com/blog/bot-traffic-report-2013.html
@lewwwinSEMcamp
Co nagle to po diable
@lewwwinSEMcamp
Co nagle to po diable
@lewwwinSEMcamp
Przypadek 2: roboty sieciowe atakują
@lewwwinSEMcamp
Rozwiązanie: wyklucz
^(inktomi corporation|iac search.*|yahoo! inc.|facebook inc.|stumbleupon inc.|dub6 ec2|site confidence.*
|apache ltd.|nielsen netratings|affinity internet inc|dub6 ec2|Amazon (A9|Web|Data|Tech).*|microsoft corp)$
@lewwwinSEMcamp
Uwaga na bezgłowe roboty!
• Zombie.js
• Phantom.js
• HtmlUnit
http://moz.com/blog/just-how-smart-are-search-robots
@lewwwinSEMcamp
Pułapka na robota
1. Utwórz katalog i zablokuj ruch do niego w
robots.txt dla wszystkich agentów.
2. Na swojej stronie daj link np. z obrazka 1x1px do
zablokowanego katalogu.
3. Tylko złe roboty dostaną się do tego katalogu.
4. Te roboty możesz teraz przekierować na skrypt,
który wyciągnie z nich adresy IP, User Agent itp.
5. Powyższe dane dodaj do pliku .htaccess, aby
je banować :)
@lewwwinSEMcamp
Ukrywanie się przed innymi .htaccess
Options +FollowSymLinks
RewriteEngine on
<Files .htaccess>
order allow,deny
deny from all
</Files>
<Limit GET HEAD POST>
order allow,deny
deny from 74.53.36.242
deny from 65.39.72.142
deny from keywordspy.com
deny from keywordspypro.com
allow from all
</LIMIT>
RewriteCond %{HTTP_REFERER} keywordspy.com [NC,OR]
RewriteCond %{HTTP_REFERER} keywordspypro.com
RewriteRule .* - [F]
@lewwwinSEMcamp
Nie przesadź, bo…
@lewwwinSEMcamp
HARD CORE
Tylo dla e-commerce
@lewwwinSEMcamp
Przypadek 3: psucie danych
javascript:_gaq.push(['_setAccount','UA-xxxxxx-1'],['
_addTrans','8148350','affiliation','-9223372036854775807','-
9223372036854775807','0.00','-','-','-'],['_addItem','SKU
00001','8148350','BIG refund','-','-
9223372036854775807','1'],['_trackTrans']);http://www.google-
analytics.com/__utm.gif?utmwv=5.4.6&utms=44&utmn=393079074&utmhn=
twojadomena.pl&utmt=tran&utmtid=8148350&utmtst=
affiliation&utmtto=-9223372036854775807&utmttx=-
9223372036854775807&utmtsp=0.00&utmtci=-&utmtrg=-&utmtco=-&utmcs=
UTF-8&utmsr=1366x768&utmvp=1366x550&utmsc=24- bit&utmul=en-
us&utmje=1&utmfl=11.9r900&utmdt=TITLE&utmhid=509485053&utmr=-
&utmp=/&utmht=1385061484294&utmac=UA-XXXXX-1&utmc
c=__utma=251194116.2116214072.1385060410.1385060410.1385060410.1;
__utmz=251194116.1385060410.1.1.utmcsr=(direct)|utmccn=(direct)|u
tmcmd=(none)
@lewwwinSEMcamp
Mieszanie w danych
@lewwwinSEMcamp
Czy temat BHA został wyczerpany?
• Hackowanie WiFi
• DDoS Analytics
• Zrzut 3rd cookies przez banery/iFrame
• Infekowanie ga.js
• Wyciąganie danych z autouzupełniania
przeglądarki
@lewwwinSEMcamp
SEMcamp
Na wynos
@lewwwinSEMcamp
Przejrzyj swoje widoki danych
• Uwzględnij tylko swój Hostname (^|.)twojadomena.pl$
• Wyklucz boty, roboty, crawlery, itp.
• Przejrzyj raport najlepszych treści
(email|mail|kod|tel) lub
[?&](.+)=(.*)gmail.com
• Monitoruj w dane zbierane w zdarzeniach, zmiennych
niestandardowych, własnych wymiarach
• Przejrzyj czysty profil
• Zaplanuj przegląd serwisu raz w miesiącu
@lewwwinSEMcamp
@lewwwinSEMcamp
@lewwwinSEMcamp
SEMcamp
Dzięki, że dotrwaliście do końca
Twitter
G+
Web
@lewwin
+MaciejLewinski
www.akademiaanalytics.pl
Slajdy @ SlideShare.net

More Related Content

BlackHat Analytics