Как удалить все атрибуты из HTML-кода?

Как можно очистить HTML-страницу от всех атрибутов, скриптов и лишнего контента, оставив только HTML-теги и текст? Существуют ли плагины для Sublime Text, которые могут помочь в этом процессе?
  • 4 января 2025 г. 16:03
Ответы на вопрос 2
Для удаления всех атрибутов из HTML-кода и очистки страницы от скриптов и лишнего контента, вы можете использовать регулярные выражения или различные утилиты. Ниже представлены несколько способов, как это можно сделать.

### 1. Использование регулярных выражений в Sublime Text

Вы можете использовать регулярные выражения в Sublime Text для удаления атрибутов. Вот шаги:

1. Откройте файл с вашим HTML-кодом в Sublime Text.
2. Нажмите `Ctrl + H`, чтобы открыть панель замены.
3. Убедитесь, что включены регулярные выражения (иконка `.*` должна быть активирована).
4. Введите следующий шаблон для поиска:

   ```
   <([a-zA-Z0-9]+)([^>]*)>
   ```

5. В поле замены введите:

   ```
   <$1>
   ```

6. Нажмите "Заменить все".

Этот шаг уберёт все атрибуты из тегов.

### 2. Удаление скриптов и стилей

Чтобы удалить скрипты и стили, вы можете использовать более сложное регулярное выражение:

1. В панели замены введите следующий шаблон для поиска:

   ```
   <script[^>]*>.*?</script>|<style[^>]*>.*?</style>
   ```

2. Оставьте поле замены пустым, чтобы удалить их.

3. Нажмите "Заменить все".

### 3. Плагины для Sublime Text

Есть несколько плагинов, которые могут помочь в очистке HTML:

- **HTML-CSS-JS Prettify**: Этот плагин преимущественно используется для форматирования кода, но можно использовать его для упрощения вашего HTML.
- **Remove HTML Tags**: Хотя этот плагин больше фокусируется на удалении тегов, он может быть полезен в некоторых случаях.

Вы также можете установить пакет с помощью Package Control, нажав `Ctrl + Shift + P` и выбрав "Package Control: Install Package", затем установив нужный плагин.

### 4. Использование онлайн-инструментов

Если вы не хотите использовать текстовый редактор, существуют онлайн-инструменты, такие как:

- [HTML Cleaner](https://html-cleaner.com/)
- [Clean HTML](https://cleanhtml.com/)

Эти инструменты позволяют быстро удалить атрибуты, скрипты и другие элементы.

### Заключение

Вы можете выбрать один из приведённых выше способов, в зависимости от ваших предпочтений и того, какой результат вы хотите получить.
это функция html sanitizer, гугли его под свой язык, под ide такое не встречал, хотя скорее всего есть извращенцы что написали это на регулярках, тоже гугли.
Похожие вопросы