Skip to content

Google poráží Microsoft, Amazon, IBM ve studii rozpoznávání obrázků

Lidi ve společnosti Perficient Digital nedávno zveřejnili studii o rozpoznávání obrázků ve vyhledávání, kde se dívali hlavně na přesnost daných technologií jednotlivých společností. Studie zjistila, že Google Vision porazil své konkurenty, mezi které patří zejména Amazon AWS Rekognition, IBM Watson a Microsoft Azure COmputer Vision.
Metodologie.
 
Dva lidé posbírali a označili dva tisíce obrázků ve čtyřech odlišných kategoriích, které obsahují lidi, prostředí, tabulky a produkty. Každá kategorie měla přibližně pět set obrázků. Obrázky byly sesbírány a označkovány 30. listopadu 2018 a studie probíhala až do 8. února 2019. Každý z lidí přišel s pěti přidělenými tagy k popsání každého obrázku. Perficient poté spustil všech dva tisíce obrázků ve své analýze obrázkového API, které je vypsáno výše, a podíval se na výsledky, kde unikátní set označení / tagů pro každý obrázek bylo zobrazeno pro každou API. Když byly všechny tagy pro obrázky přiděleny a byla jim také přiřazena hodnota, další obrázek byl prezentován. Tento proces hodnocení trval zhruba od 12. dubna do 9. května.
 
Ale je toho ještě víc.
 
Studie se opravdu hluboce ponořila do několika různých způsobů, jak nakrájet a prozkoumat data, takže bychom doporučili, abyste se podívali na celou studii přímo ZDE.
 
Proč nás to zajímá.
 
Zaprvé, technologie rozpoznávání obrázků ve vyhledávání je docela přesná a stává se čím dál tím lepší den co den. S bodováním důvěry 80 % studie zjistila, že skóre pro ručně označené obrázky je vlastně rovna výsledkům Amazon AWS Rekognition technologie, Google Vision a Microsoft Azure Computer Vision.
 
Zadruhé, určitě bychom si měli poznamenat, že zatímco Google a Bing provádějí rozpoznávání obrázků ve vyhledávání – určitě byste předpokládali, že to, co internetové vyhledávače používají, je trošičku pokročilejší a umělečtější než to, co společnosti zveřejňují veřejnosti s API. Takže byste museli předpokládat, že obrázková vyhledávání na Google a Bingu jsou ještě lepší, když dojde na rozpoznávání obrázků.