Теперь никто не уйдёт от цифрового правосудия!
Тёмная сеть (dark web) — это часть Интернета, которая скрыта от обычных пользователей и доступна только через специальные анонимизирующие программы, такие как Tor . В тёмной сети происходят различные незаконные действия, такие как продажа запрещённых веществ, оружия, фальшивых документов и хакерских услуг.
Учёные из Южной Кореи Для просмотра ссылки Войдиили Зарегистрируйся искусственный интеллект, который может анализировать и извлекать полезную информацию из текстов тёмной сети. Их ИИ называется DarkBERT и основан на архитектуре RoBERTa — одном из самых мощных подходов к обработке естественного языка, разработанном в 2019 году.
Для обучения модели учёные собрали большую базу данных из текстов тёмной сети, просканировав её через сеть Tor, и затем отфильтровали повторяющуюся информацию, а также информацию не по теме. Потом они использовали эту базу данных для обучения RoBERTa LLM — модели, которая может обрабатывать тексты тёмной сети и выделять в них ключевые элементы.
Учёные показали, что DarkBERT превосходит другие большие языковые модели по качеству анализа текстов тёмной сети. Это может помочь специалистам по кибербезопасности и правоохранительным органам проникнуть глубже в уголки интернета, где скрываются преступники. Однако DarkBERT ещё не доведён до совершенства и требует дальнейшего обучения и настройки. Как точно он будет использоваться и какие знания сможет предоставить — пока неизвестно.
Тёмная сеть (dark web) — это часть Интернета, которая скрыта от обычных пользователей и доступна только через специальные анонимизирующие программы, такие как Tor . В тёмной сети происходят различные незаконные действия, такие как продажа запрещённых веществ, оружия, фальшивых документов и хакерских услуг.
Учёные из Южной Кореи Для просмотра ссылки Войди
Для обучения модели учёные собрали большую базу данных из текстов тёмной сети, просканировав её через сеть Tor, и затем отфильтровали повторяющуюся информацию, а также информацию не по теме. Потом они использовали эту базу данных для обучения RoBERTa LLM — модели, которая может обрабатывать тексты тёмной сети и выделять в них ключевые элементы.
Учёные показали, что DarkBERT превосходит другие большие языковые модели по качеству анализа текстов тёмной сети. Это может помочь специалистам по кибербезопасности и правоохранительным органам проникнуть глубже в уголки интернета, где скрываются преступники. Однако DarkBERT ещё не доведён до совершенства и требует дальнейшего обучения и настройки. Как точно он будет использоваться и какие знания сможет предоставить — пока неизвестно.
- Источник новости
- www.securitylab.ru