Как да си намирате лийдове с ИИ? :)

metaverse

Well-Known Member
Днес се заиграх с и брейнстормнах с Gemini инструмент за намиране на лийдове. В случая ми трябваше ефективен и евтин начин да намирам Wordpress сайтове за cold email кампанията ни.

Няколко часа по-късно инструмента има капацитет за ~60к сайта дневно.

Bash:
{
  "status": "ok",
  "data": {
    "TotalProcessed": 78109,
    "WordPressDetected": 3396,
    "NotWordPress": 68562,
    "Failed": 6151,
    "DetectionRate": 4.71941966146919,
    "Pending": 1811938,
    "Processing": 91425,
    "CheckedPerMinute": 1192.36608793175,
    "LastCheckTime": "2025-11-20T18:55:16.554621Z"
  },
  "timestamp": "2025-11-20T18:59:09.637404899Z"
}

Bash:
root@wphunt:/opt/wphunt# docker ps
CONTAINER ID   IMAGE                      COMMAND                  CREATED          STATUS                    PORTS                                         NAMES
3208faa9892e   wphunt-listener:latest     "./ng-service"           54 minutes ago   Up 13 minutes                                                           wphunt-listener
ac006b039bb9   wphunt-poller:latest       "./ng-service"           54 minutes ago   Up 13 minutes                                                           wphunt-poller
1ed30a9f970f   wphunt-writer:latest       "./ng-service"           54 minutes ago   Up 13 minutes                                                           wphunt-writer-2
e533476ab9b2   wphunt-poller:latest       "./ng-service"           54 minutes ago   Up 13 minutes                                                           wphunt-poller-2
70537686fa31   wphunt-writer:latest       "./ng-service"           54 minutes ago   Up 13 minutes                                                           wphunt-writer-3
c29a9f7276c9   wphunt-writer:latest       "./ng-service"           54 minutes ago   Up 13 minutes                                                           wphunt-writer
64dd6b178f9e   lestream-server:latest   "/app/lestream-ser…"   54 minutes ago   Up 13 minutes (healthy)   8080/tcp                                      lestream-server
b6feb1d12ddb   wphunt-recorder:latest     "./ng-service"           54 minutes ago   Up 13 minutes             0.0.0.0:8080->8080/tcp, [::]:8080->8080/tcp   wphunt-recorder
86755a6d75b7   postgres:18.0-bookworm     "docker-entrypoint.s…"   2 hours ago      Up 2 hours                5432/tcp                                      postgres

Най-хубавото е, че са пресни, пресни, защото обработва https://certificate.transparency.dev в реално време. Демек всички намерени сайтове са активни.

Трябва му малко повече зоб за да си обработи опашката де ама за POC толкова.

За подобни данни в момента плащаме $500 месечно, а в същото време са ужасни като качество. Голяма част са изтекли домейни, сменена платформа (т.е. не са Wordpress вече) и т.н.

Detection rate-a е само 4.7%, защото съм му добавил едва няколко метрики, по които да засича Wordpress и не се заглежда много ако например WAF го блокира.

Остана само да му добавя да обогатява данните с мета данни като контакти на собственици, linkedin профили, държава, хостинг и каквото още сметнем за полезно за нуждите ни и да го закачим към системата за маркетинг, което също е изцяло ИИ.

Идеята е да автоматизираме бавния ръчен процес. При ръчните кампании конверсията ни е 30-40%, но е много бавна ръчна работа. Ако с този инструмент имаме дори 1% ще е в пъти по-ефективно и евтино.

И не, не ни интересува GPDR.
 
Качих първоначалната версия на AX41 машинка в Hetzner.

Сега успява да се справи с цялата опашка идваща от CT, която е около 3,000,000 сертификата на час при текущата конфигурация. Като към инструмента идват повече от 3м, защото сертификатите понякога не са само за един домейн.

1к обработени на лаптопа срещу почти 30к с AX41. Пробвах с няколко десктопа в нас и с едно MacMini с i9, но така и не го докарах до повече от 5-10к, защото нямаше как да пусна достатъчно writers за да не се губят заявки.

Направих и доста оптимизации. Например пропуска honey pot домейни, сайтове на държавни агенции, ако DNS проверката не мине за под 500ms не продължава към http и др. Т.е. може да бъде по-точен, но дори в този вид намира повече от достатъчно сайтове.

Логвам всички failed, така че по-натам и за тях ще изкарам някаква статистика. Може би ще направя нещо като https://builtwith.com Също ще се види кои хостинг компании в ЕС (като начало) са бавни.

Код:
{
  "status": "ok",
  "data": {
    "TotalProcessed": 690893,
    "WordPressDetected": 1150,
    "NotWordPress": 15866,
    "Failed": 673877,
    "DetectionRate": 6.75834508697696,
    "Pending": 0,
    "Processing": 602,
    "CheckedPerMinute": 27057.3577339481,
    "LastCheckTime": "2025-11-21T17:33:53.440256Z"
  },
  "timestamp": "2025-11-21T17:35:41.909835835Z"
}

Код:
# docker ps
CONTAINER ID   IMAGE                      COMMAND                  CREATED          STATUS                    PORTS                                         NAMES
24ad050195fd   postgres:18.0-bookworm     "docker-entrypoint.s…"   29 minutes ago   Up 29 minutes             5432/tcp                                      postgres
9c90fcc8405b   wphunt-listener:latest     "./ng-service"           30 minutes ago   Up 29 minutes                                                           wphunt-listener
214d572d006f   wphunt-writer:latest       "./ng-service"           30 minutes ago   Up 29 minutes                                                           wphunt-writer-7
bc40059392f3   wphunt-writer:latest       "./ng-service"           30 minutes ago   Up 29 minutes                                                           wphunt-writer-5
cc777a2b01cc   wphunt-writer:latest       "./ng-service"           30 minutes ago   Up 29 minutes                                                           wphunt-writer-4
7caef7693865   wphunt-writer:latest       "./ng-service"           30 minutes ago   Up 29 minutes                                                           wphunt-writer-8
e18f925af0d2   wphunt-writer:latest       "./ng-service"           30 minutes ago   Up 29 minutes                                                           wphunt-writer
4b2088b89114   lestream-server:latest   "/app/lestream-ser…"   30 minutes ago   Up 30 minutes (healthy)   8080/tcp                                      lestream-serverer
ca3d8389126c   wphunt-writer:latest       "./ng-service"           30 minutes ago   Up 29 minutes                                                           wphunt-writer-6
1abc2e037430   wphunt-janitor:latest      "./ng-service"           30 minutes ago   Up 29 minutes                                                           wphunt-janitor
9e2b977416ab   wphunt-poller:latest       "./ng-service"           30 minutes ago   Up 29 minutes                                                           wphunt-poller
13f80f376f16   wphunt-writer:latest       "./ng-service"           30 minutes ago   Up 29 minutes                                                           wphunt-writer-2
91532494577f   wphunt-writer:latest       "./ng-service"           30 minutes ago   Up 29 minutes                                                           wphunt-writer-3
1fafe21e7f46   wphunt-recorder:latest     "./ng-service"           30 minutes ago   Up 29 minutes             0.0.0.0:8080->8080/tcp, [::]:8080->8080/tcp   wphunt-recorder

Screenshot 2025-11-21 at 19.38.26.png

Нещо рамта не я използва добре ама ще търся друг път какво да променя.

Докато събира сайтове ще имплементирам обогатяването на данните. Ако не ме срежат в Hetzner де, защото яде по 60-80Mbps и реално е crawler, а те не са фен.

Ще видим каква конверсия ще докара като добавя автоматичния аутрийч с ИИ. Имам доста идеи как да стане много добре.

Като цяло е хитър процес и съм приятно изненадан, че Gemini успя да се справи със спецификацията, а после Sonnet 4.5 с имплементацията.

Също оказа се, че маркетолозите в Reddit и Twitter имат интерес да се абонират. Данните са в реално време.

Та, понеже има теми как се правят пари с ИИ. :)
 
Последно редактирано:
  • Sad
Реакции: Sky

Горе