Я не специалист и принцип их работы не опишу. Возьми, брось драг'н'дропом любую картинку в строку поиска гугла увидишь что он выдаст. Tineye.com и яндекс тоже ищут более чем.
> Они распознают, что написано/изображено на картинке? Или ищут по другим признакам?
Нет не распознают.
Например, гугл не может отличить собственный логотип от логотапа ebay[censored]
Насколько знаю, они что-то типа хэш-сумм считают.
Но не по одному параметру, а по нескольким (например, гистограммы для разных каналов RGB, могут сравнивать). Таким образом удаётся находить похожие изображения даже после ресайза, шарпа и с разным балансом белого.
Полюс ещё название, и метадату на всякий случай смотрит, чтобы два раз не вставать.
Пользователю на запрос показывают кучу картинок (некоторые могут быть ни хрена не похожи) и дальше смотрят, по каким он ссылкам пойдёт, а какие проигнорирует. А заодно просят написать, что же это такое он запостил, если точных соответствий не найдено.
По результатам растёт база соответствий, что вот эти две картинки с довольно разными цифрами на самом деле одно и то же, а вот эти две совсем разные, хотя цифры и похожи.