Днес се заиграх с и брейнстормнах с Gemini инструмент за намиране на лийдове. В случая ми трябваше ефективен и евтин начин да намирам Wordpress сайтове за cold email кампанията ни.
Няколко часа по-късно инструмента има капацитет за ~60к сайта дневно.
Най-хубавото е, че са пресни, пресни, защото обработва https://certificate.transparency.dev в реално време. Демек всички намерени сайтове са активни.
Трябва му малко повече зоб за да си обработи опашката де ама за POC толкова.
За подобни данни в момента плащаме $500 месечно, а в същото време са ужасни като качество. Голяма част са изтекли домейни, сменена платформа (т.е. не са Wordpress вече) и т.н.
Detection rate-a е само 4.7%, защото съм му добавил едва няколко метрики, по които да засича Wordpress и не се заглежда много ако например WAF го блокира.
Остана само да му добавя да обогатява данните с мета данни като контакти на собственици, linkedin профили, държава, хостинг и каквото още сметнем за полезно за нуждите ни и да го закачим към системата за маркетинг, което също е изцяло ИИ.
Идеята е да автоматизираме бавния ръчен процес. При ръчните кампании конверсията ни е 30-40%, но е много бавна ръчна работа. Ако с този инструмент имаме дори 1% ще е в пъти по-ефективно и евтино.
И не, не ни интересува GPDR.
Няколко часа по-късно инструмента има капацитет за ~60к сайта дневно.
Bash:
{
"status": "ok",
"data": {
"TotalProcessed": 78109,
"WordPressDetected": 3396,
"NotWordPress": 68562,
"Failed": 6151,
"DetectionRate": 4.71941966146919,
"Pending": 1811938,
"Processing": 91425,
"CheckedPerMinute": 1192.36608793175,
"LastCheckTime": "2025-11-20T18:55:16.554621Z"
},
"timestamp": "2025-11-20T18:59:09.637404899Z"
}
Bash:
root@wphunt:/opt/wphunt# docker ps
CONTAINER ID IMAGE COMMAND CREATED STATUS PORTS NAMES
3208faa9892e wphunt-listener:latest "./ng-service" 54 minutes ago Up 13 minutes wphunt-listener
ac006b039bb9 wphunt-poller:latest "./ng-service" 54 minutes ago Up 13 minutes wphunt-poller
1ed30a9f970f wphunt-writer:latest "./ng-service" 54 minutes ago Up 13 minutes wphunt-writer-2
e533476ab9b2 wphunt-poller:latest "./ng-service" 54 minutes ago Up 13 minutes wphunt-poller-2
70537686fa31 wphunt-writer:latest "./ng-service" 54 minutes ago Up 13 minutes wphunt-writer-3
c29a9f7276c9 wphunt-writer:latest "./ng-service" 54 minutes ago Up 13 minutes wphunt-writer
64dd6b178f9e lestream-server:latest "/app/lestream-ser…" 54 minutes ago Up 13 minutes (healthy) 8080/tcp lestream-server
b6feb1d12ddb wphunt-recorder:latest "./ng-service" 54 minutes ago Up 13 minutes 0.0.0.0:8080->8080/tcp, [::]:8080->8080/tcp wphunt-recorder
86755a6d75b7 postgres:18.0-bookworm "docker-entrypoint.s…" 2 hours ago Up 2 hours 5432/tcp postgres
Най-хубавото е, че са пресни, пресни, защото обработва https://certificate.transparency.dev в реално време. Демек всички намерени сайтове са активни.
Трябва му малко повече зоб за да си обработи опашката де ама за POC толкова.
За подобни данни в момента плащаме $500 месечно, а в същото време са ужасни като качество. Голяма част са изтекли домейни, сменена платформа (т.е. не са Wordpress вече) и т.н.
Detection rate-a е само 4.7%, защото съм му добавил едва няколко метрики, по които да засича Wordpress и не се заглежда много ако например WAF го блокира.
Остана само да му добавя да обогатява данните с мета данни като контакти на собственици, linkedin профили, държава, хостинг и каквото още сметнем за полезно за нуждите ни и да го закачим към системата за маркетинг, което също е изцяло ИИ.
Идеята е да автоматизираме бавния ръчен процес. При ръчните кампании конверсията ни е 30-40%, но е много бавна ръчна работа. Ако с този инструмент имаме дори 1% ще е в пъти по-ефективно и евтино.
И не, не ни интересува GPDR.
