пятница, 1 февраля 2013 г.

сайт для поиска копий картинок

Склейка дублей позволила определить тот небольшой процент изображений, который интересен многим веб-мастерам и, соответственно, пользователям. Для таких картинок имеется множество подписей, их можно сравнить между собой и с запросом для того, чтобы понять, насколько картинка правильно ему соответствует.

Когда мы начали решать задачу поиска дубликатов, мы просто хотели “почистить” выдачу от повторяющихся картинок и сделать выдачу более разнообразной. Но впоследствии мы поняли, что в наших руках оказалось нечто большее. Веб-мастера не любят в свои страницы вставлять картинки, которые загружаются с других сайтов, они их копируют, и зачастую меняют размеры, чтобы вписать в свой дизайн. Каждой копии картинки доставалось меньше подписей, поэтому не всегда просто было понять, насколько картинка соответствует запросу?

Компания Яндекс провели исследование картинок Рунета и оказалось, что из 600 млн. изображений половина уникальна (300 млн.), вторая же половина формируется в отношении 3:1, 200 из 300 млн. имеют дубликаты только на своем ресурсе.

Поиск точных копий изображений никогда не был сложным для поисковых систем алгоритмом, однако незначительные модификации, изменение размеров картинки, добавление надписей или же обычное пережатие JPG файла помогали изображению стать уникальным и попасть в результаты поиска в виде дубликата (клона).

Как сегодня на официальном блоге Яндекс, сервис Яндекс.Картинки научились находить одинаковые изображения в сети Интернет.

Автор: Сергей Кокшаров в , 24/10/2008

Яндекс.Картинки будут фильтровать клонов

Devaka: Яндекс.Картинки будут фильтровать клонов

Комментариев нет:

Отправить комментарий