Архив Черный Data Science. По скринам, логам, текстовым массивам. Кастомные запросы.

  • Автор темы enterx7
  • Дата начала
  • Просмотров 3868 Просмотров
  • Внимание! Тема находится в Архиве, Мы не рекомендуем совершать сделку!

enterx7

Black Data Science
4
0
18 Сен 2022
black_flyer_1__1024x768__rus.png



==================================
Черный Data Science, а также...
- отработка логов, текстовых массивов на наличие CC/CVV;
- считывание нейросетью со скринов данных о CC/CVV;
- валидация CC/CVV, преобразование в формат чекеров, шопов;
- кастомные запросы;
- иное сотрудничество в программной обработке данных.

Высокие скорости. Многопоточное программирование.
Нейросети трудятся на GPU.


==================================
FAQ:

*** Как работает схема с отработкой скринов, поиском CC/CVV в логах/текстовых массивах?
1) Отправляете пачку скринов/текстовых_файлов/логов на/в которых могут быть интересующие данные.
2) Получаете сигнал о том, что отработка закончена и скрин с частью готовых результатов.
3) Отправляете средства гаранту.
4) Получаете дамп базы (sql) либо csv.



*** Как работает схема с валидацией данных CC/CVV, преобразованием в формат чекеров, шопов?
В целом аналогично с предыдущим пунктом.


*** Что такое доля годности для отработки скринов?

Пусть есть 100 скринов с разрешением 1024 x 768 px. На 5 скринах обнаружены данные о CC/CVV.
Доля годности составит: 5 / 100 = 0.05



*** Что такое процент годности для отработки текстовых массивов / логов?
Процент годности для текстовых массивов / логов рассчитывается схожим образом с предыдущим пунктом. При этом базой расчета является количество обнаруженных CC/CVV на 1 мегабайт текстовых данных.


*** Какова минимально допустимая доля годности?

Отрабатывать скрины / текстовые массивы / логи с нулевой долей годности - так себе занятие... По понятным причинам. При этом заранее точно определить процент годности довольно сложно. Лишь косвенно, через происхождение данных. Поэтому если вы намереваетесь дать в отработку логи/текстовые массивы, вы должны быть уверены, что источник заслуживает внимания. Минимально допустимая доля годности принимается равным 0.03.
Если вы не уверены в источнике, не тратьте время.



*** Необходимо провести валидацию строк CC/CVV. Далее привести к формату шопов. Влияет ли доля годности на стоимость обработки?
Не влияет. Стоимость определяется исходя из количества строк переданных в обработку.


*** Как добывать потенциально интересные скрины?
Обычно скрины добываются двумя способами:
- используя стиллер;
- используя роботы-пауки, которые бродят по полям сервисов, таких как Lightshot.
При этом скрины полученные вторым способом имеют меньший процент годности. Кастомизируйте таргеты для пауков для повышения доли годности.
Более полный список графических сервисов, например, здесь:
esputnik.com/blog/13-servisov-dlya-sozdaniya-skrinshotov
Также рекомендуется к прочтению:
vk.com/@haccking1-bluzhdaem-po-prostoram-github-dyry-skripty-qr-kody-i-chertov



*** Как написать паук для скринов?
Отправной точкой может быть:
Для просмотра ссылки Войди или ЗарегистрируйсяНа github масса материалов.



*** Почему описанном здесь арсенале нет подобных пауков?
Потому, что работа с пауками это целое направление.
У специализации есть свои плюсы.



*** Какого цвета должны быть скрины?
- Важен не столько цвет, сколько контрастность текста и фона.


*** Каковы параметры для считывания запросов со скринов?
- Поддерживаемые форматы: png, jpg, tiff.
- Рекомендуемый вес одного файла не более 2 Mb.
- Не рукописный текст!
- Рекомендуемый размер: с 1024 x 768 по px 1920 x 1200 px.



*** По каким странам возможна активность?
Допустимы таргеты по странам:
США, Канада, Англия, а также
Австралия, Польша, Словакия, Португалия, Испания, Франция, Дания, Норвегия,
Германия, Хорватия, Финляндия, Словения, Италия, Румыния.



*** Данные обрабатываются только нейросетью?

Ориентировочно данные обрабатываются:
- нейросетью на 70%;
- регулярками на 20%;
- человеком на 10%.



*** При валидацию строк CC/CVV - какой вид имеет вывод о качестве поставки? Какие пункты в нем содержатся?
Вид статистики поставки содержится в файле example_report_delivery_ru.png.


*** Каков стэк?
Python, Keras, TensorFlow,
Scikit-learn, Scipy, OpenCV,
multiprocessing, asyncio, aiohttp, asyncpg, psycopg2, pandas, re,
FastAPI,
PostgreSQL, MySQL.



*** А если попробовать отправить малварь?....
Экономьте свое время.
Получаемые файлы проходят многоступенчатую проверку.




*** Какое время активности?
Ориентировочно 9.00 - 21.00 МСК.


*** Какова стоимость обработки?
С каждым заказчиком оговаривается отдельно.


*** Можно ли напрямую, без гаранта?

Все операции через гаранта.




Контакты:
jabber: [email protected]

element.io: Для просмотра ссылки Войди или Зарегистрируйся
teams.wire.: Для просмотра ссылки Войди или Зарегистрируйся

qTox: 83E39F9AA994C1FF8B1316B98FF0E240D11C9B23F653A23F5A594E11B7C27915E08DCBAF6BE6