Для парсинга всех страниц интернет-магазина, за исключением страниц с карточками товаров, можно написать скрипт на Python, используя библиотеку requests для загрузки страниц и библиотеку BeautifulSoup для парсинга HTML-кода.
Пример скрипта:
```python
import requests
from bs4 import BeautifulSoup
url = 'https://example.com' # URL интернет-магазина
response = requests.get(url)
soup = BeautifulSoup(response.content, 'html.parser')
for link in soup.find_all('a', href=True):
if 'product' not in link['href']: # исключаем страницы с карточками товаров
print(link['href'])
```
Чтобы определить страницу с контактной информацией в веб-краулере, можно использовать различные признаки на странице, такие как наличие ключевых слов типа "контакты", "связь", "email" и т.п. Также можно анализировать структуру HTML-кода, например, наличие определенных тегов или классов.
Для исключения из обхода страниц с карточками товаров при помощи RegExp фильтрации, можно модифицировать скрипт выше, добавив регулярное выражение для исключения определенных URL-адресов:
```python
import re
for link in soup.find_all('a', href=True):
if not re.search(r'/product/\d+', link['href']): # исключаем страницы с карточками товаров
print(link['href'])
```
Это регулярное выражение будет исключать все ссылки, содержащие "/product/" и последующую цифровую часть в URL-адресе.