I sin officielle blog fortæller Google at man har bygget et helt nyt indekserings-system under kodenavnet Caffeine, som skal levere 50 procent friskere resultater end det forhenværende system. Når man søger på Google, så foregår søgningen jo som bekendt ikke på selve nettet, men i Google eget søgeindeks, som er Googles eget spejlbillede af nettet og kan sammenlignes med ordfortegnelsen i en bog.
Men dette indeks vil aldrig være en akkurat kopi af nettet, for websiderne ændres konstant med nye informationer – så indekset er i princippet forældet, så snart det er færdigt.
Det gamle Google indeks havde flere lag, hvor nogle lag blev genopfrisket hurtigere end andre; hovedlaget blev genopfrisket med et par ugers mellemrum. Men det krævede, at Googles søgeprogrammer skulle grave sig gennem hele nettet, hvilket betyder at der går et stykke tid fra programmerne finder en ny side til den bliver tilgængelig i søgeindekset.
Med Caffeine bliver nettet analyseret i små portioner af gangen og indekset bliver opdateret kontinuerligt. Når Google finder nye sider, eller ændringer på gamle sider, bliver de tilføjet til indekset med det samme.
Hvert eneste sekund kan Caffeine behandle hundredtusindvis af sider, fortæller Google. Indekset fylder omkring 100 millioner gigabyte – 100 petabyte – og det vokser med over 100.000 gigabyte om dagen.
Hvis hele Googles nye søgeindeks skulle gemmes på en iPod, så ville det kræve 625.000 af de største iPods, og hvis man stablede dem oven på hinanden, så ville bunken være mere end 60 kilometer høj, har Google regnet sig frem til.