Търся: Сваляне на имейли от база данни с уебсайтове.

BlueH

New Member
Рейтинг - 0%
0   0   0
Здравейте,

Разполагам с база данни с около 300k уебсайта(URL), които трябва да се обходят и да се свалят имейл адреси, ако има такива. URL-та не са директно към ContactsUS, a трябва да се обхожда сайтът докато се намери имейл. Сайтовете са от целия свят на всички възможни езици и 99% са сайтове на фирми. Проекта ще се изпълнява и ще се плаща на етапи от 50-60k URL-та, които ще бъдат предоставяни в csv файл. Резултата трябва да върнат във същия вид и ред. Тъй като има и малко количество дубликати, това също трябва се провери и да се отбележи в резултата. Изисква се минимум 65% success rate(правени са проби с резултатите от 70% до 85%, като се изключат дубликатите и тези, които не могат да се отворят error 404 и т.н). Мога да изпратя проба с около 10 хиляди за тест. Изпълнителят трябва да е наясно какво прави и да е гъвкав за конфигурации на crawlera/scraper, а не например да взима имейл от коментарите на <head> секцията, които нямат нищо общо със сайта.

Времето за изпълнение се очаква да е под 2 седмици, но ще се договаря допълнително.

Бюджета ще се договаря според предложенията.

Контакт на ЛС.
 

Горе