Как создать антидетект-браузер на основе Chromium или Firefox, который обеспечит уникальный фингерпринт на страницах, и не будет обнаруживаться как автоматизированный инструмент, использующий Selenium или Puppeteer?
Создание браузера, который обходит системы обнаружения и блокировки, может быть незаконным и нарушать правила использования определенных веб-сервисов. Такие действия могут быть квалифицированы как нарушение безопасности и конфиденциальности данных. Если вы хотите создать антидетект-браузер на основе Chromium или Firefox, чтобы обеспечить уникальный фингерпринт и избежать обнаружения как автоматизированный инструмент, есть несколько методов, которые можно попробовать: 1. Маскировка юзер-агента: изменение строки User-Agent в настройках браузера для эмуляции обычного пользователя. 2. Изменение отпечатка браузера: модификация параметров браузера, таких как разрешение экрана, язык и т.д., чтобы создать уникальный фингерпринт. 3. Использование виртуальных машин: запуск браузера в виртуальной машине с уникальными настройками. 4. Использование прокси-серверов: регулярное изменение IP-адреса с помощью прокси-серверов. 5. Блокировка скриптов: блокировка скриптов, которые могут быть использованы для обнаружения автоматизированных инструментов. Важно помнить, что использование таких методов может нарушить правила использования веб-сервисов и привести к негативным последствиям, включая блокировку вашего аккаунта или юридические проблемы. Поэтому перед использованием антидетект-браузера рекомендуется ознакомиться с политикой конкретного сайта или сервиса.
0. Найти сайты с проверками на каждый чих, либо написать свою страницу со всем в комплекте (лучше).
1. Использовать в качестве драйвера браузера undetected chromedriver, либо написать свой (лучше).
2. Качнуть исходники хромиума (~60 гигов), переписать некоторый код так, чтобы он передавал трекерам ту информацию, которую он получил в момент запуска от п1.
3. Используя selenium и п1 запустить п2 с переходом на п0.
4. (опционально) Написать тесты, которые будут сопоставлять данные с п0 и данные, которые передает п2, и если все совпало, то лишь затем выполнять парсинг.
UPD:
- Использовать разные браузеры и операционки не потребуется (можно притвориться любым).
- Обновлять п2 не придется так же часто, как и сам хромиум, т.к. с обновами не так много меняется.
Откровенно - не дочитал твой вопрос.
Основная проблема создания антика на хроме - лень в изучении исходного кода, а особенно - сервис воркера, который при абсолютно любых попытках его настроить - подтекает
Чтоб создать антик - нужно вытащить все сенситив параметры в аргументы, и аргументы обернуть в клиент. Текущих аргов недостаточно, иначе бы антиков было овер-овер, а их - с десяток.
Дело - неблагодарное, придется чекать на 20 сайтах насколько хорошо все сделал, пилить обновы с каждым новым хромом, и крч. Вебгл и канву вынеси таким образом - будут деньги
1) Есть такой например https://github.com/uazo/cromite/
Функций которые раскрывают уникальные данные - много. Поэтому действительно делать это тяжело и муторно. Но хотя бы есть инструкция, а так же уже много готовых патчей в репозитории который я указал
2) Видел решение автоматизации через Devtools и расширение. В devtools можешь настроить, заменить например userAgent, в расширении настроить content скрипт, который запускается раньше страницы
Если эти пункты заюзать, то сайт не будет точно ругаться на автоматизацию. Но все равно может через время понять что ты бот, так как отпечатки будут похожи. Надо useragent и ТД менять тоже