Google tager billed-genkendelse til et nyt niveau

Bedre billedsøgninger og tekstforklaringer er målet for Google, der kombinerer flere teknologier i ny løsning.

Artikel top billede

En floskel lyder, at et billede siger mere end 1.000 ord.

Den frase har søgeselskabet Google så at sige vendt om, så googlernes billedsøgninger fremover skal bruges til mere præcist at beskrive og finde billeder på verdens største søgemaskine.

Google forklarer, at nye måder at kombinere forskellige søgeteknologier på vil gøre selskabets søgemaskineri bedre til at finde billedmatches ved brug af komplekse søgetermer som 'to pizzaer ligger på en ovn'.

Dermed tager selskabet (endnu) et skridt mod at gøre sin søgemaskine mere menneskelig, så en bruger dels ikke længere behøver at spekulere i maskinvenlige søgetermer. Snarere kan han/hun beskrive sin billedsøgning i dagligdags tale og samtidig få bedre, forklarede billedresultater.

"Vi har udviklet et maskinlæringssystem, der automatisk kan producere billedtekster til præcist at beskrive billederne, så snart vi ser dem," forklarer Oriol Vinyals, Alexander Toshev, Samy Bengio og Dumitru Erhan fra Googles Research-team på selskabets blog.

Kombinerer teknologier

I dag er det muligt at søge efter billeder med ord eller simpelthen uploade eller trække billeder ind Googles billed-søgefelt.

Dermed søges der efter billeder, der matcher det enkelte ord eller form- og farveligheder med det uploadede billede.

Med Googles nye billedsøgninger bliver flere forskellige parametre sat i spil for eksempel ord som 'to', 'pizzaer', 'ligger på' og 'en ovn' - og ikke mindst ordenes indbyrdes relation til hinanden.

"En præcis beskrivelse af et komplekst scenario kræver en dybere repræsentation af, hvad der foregår, en forståelse for objekternes indbyrdes relationer og derefter skal man oversætte det til hele på et forklarligt sprog," skriver Google Research-medarbejderne på bloggen.

Mere specifikt kombinerer Google neurale systemer trænet til at klassificere objekter på et billede med neurale netværk, der kan producere ord og sætninger, der minder om vores naturlige sprog - uanset hvilket sprog, man taler.

Kørt flere tests

Google har inden blog-publiceringen af den nye søgeteknologi afprøvet sit nye billedsøgesystem med åbne datasæt fra blandt andre Flickr og Pascal.

"De genererede sætninger er fornuftige. Systemet gør det også godt i kvantitative evalueringer med BLEU," skriver Google-medarbejderne på bloggen.

Her er BLEU (Bilingual Evaluation Understudy) en algoritme, der bruges til at evaluere kvaliteten af en sætning, der er maskinoversat fra et sprog til et andet.

Teknologien er stadig i sin vorden, og du kan læse mere om Googles billed- og tekstsøgningsteknologi her.

Google genopfinder mail-klienten med Inbox


Google risikerer bøde på 35 milliarder for unfair søgeresultater

Læses lige nu
    Computerworld Events

    Vi samler hvert år mere end 6.000 deltagere på mere end 70 events for it-professionelle.

    Ekspertindsigt – Lyt til førende specialister og virksomheder, der deler viden om den nyeste teknologi og de bedste løsninger.
    Netværk – Mød beslutningstagere, kolleger og samarbejdspartnere på tværs af brancher.
    Praktisk viden – Få konkrete cases, værktøjer og inspiration, som du kan tage direkte med hjem i organisationen.
    Aktuelle tendenser – Bliv opdateret på de vigtigste dagsordener inden for cloud, sikkerhed, data, AI og digital forretning.

    It-løsninger | Online

    Kod smartere med GitHub Copilot

    Få styr på GitHub Copilot og skriv bedre kode hurtigere. Se hvordan Copilot løser opgaver, sparrer på fejl og løfter komplekse workflows. Oplev live demo og lær hvordan du kommer i gang med licenser og opsætning.

    Sikkerhed | København

    Cyber Threats

    Få teknisk indsigt og konkrete løsninger til at modstå moderne cyberangreb. Lær af fejl, stop angreb i tide og byg systemer med ægte resiliens. Fokus på lavniveau-detektion, netværksovervågning og hurtig gendannelse. Deltag i Cyber Threats fra...

    It-løsninger | København V

    Platform X 2026: Forretning, teknologi og transformation

    Mød verdens stærkeste og mest effektive platforme der driver den digitale transformation samlet i København - og dyk ned i den nyeste teknologi.

    Se alle vores events inden for it

    Navnenyt fra it-Danmark

    Pentos har pr. 2. juni 2025 ansat Erik Ebert som Country Manager. Han skal især beskæftige sig med udvidelsen af Pentos til Danmark og Norden. Det kræver bl.a. etablering af et lokalt leverance team og SAP Partnerskab. Han kommer fra en stilling som Senior Director hos Effective People. Han har tidligere beskæftiget sig med HR systemer baseret på SAP SuccessFactors hos en række danske større og mellemstore virksomheder. Nyt job

    Erik Ebert

    Pentos

    Renewtech ApS har pr. 1. marts 2026 ansat Emil Holme Fisker som Customer Service Specialist. Han skal især beskæftige sig med at levere høj kvalitets kundeservice og hjælpe Renewtechs kunder med at få de rette løsninger til deres behov. Han kommer fra en stilling som Key Account Manager hos Camro A/S. Han er uddannet som salgselev hos Camro A/S. Han har tidligere beskæftiget sig med at udvikle gode kunderelationer, opsøgende salg og udvikling af salgsaktiviteter. Nyt job

    Emil Holme Fisker

    Renewtech ApS

    Immeo har pr. 1. maj 2026 ansat Sofie Amalie Buur som Consultant. Hun kommer fra en stilling som Frontend Engineer & UI/UX Designer hos Valyrion. Hun er uddannet Cand.it. Softwaredesign ved ITU. Nyt job
    IFS Danmark A/S har pr. 2. marts 2026 ansat Marlene Gudman som HR Business Partner. Hun skal især beskæftige sig med HR i Danmark og Norden og lede udvalgte internationale HR-projekter. Hun kommer fra en stilling som Nordic Lead HR Business Partner hos Salesforce. Hun har tidligere beskæftiget sig med international HR med fokus på udvikling af og udfordringer i HR ud fra et forretningsperspektiv. Nyt job

    Marlene Gudman

    IFS Danmark A/S