Запуск Firefox под разными профилями
Октябрь 17, 2017
“C:\Program Files\Mozilla Firefox\firefox.exe” -p -no-remote
http://gusarev.livejournal.com/8657.html
“C:\Program Files\Mozilla Firefox\firefox.exe” -p -no-remote
http://gusarev.livejournal.com/8657.html
Плюс слова для вордстата для исследования проблем вопросов клиентов в новой нише: “какой”, “выбрать”, “лучше”, “отзыв”.
<?php
function tansl($dir) {
if ($handle = opendir($dir)) {
//echo “Дескриптор каталога: $handle \n”;
//echo “Файлы: \n”;
while (false !== ($file = readdir($handle))) {
if ($file != “.” && $file != “..”)
{
$transl_file = urldecode($file);
// меняем имена файлов(не каталогов)
if(preg_match(‘/\.(.*)/’, $file)){
if (basename($file) == ‘этот файл не трогать’) continue;
copy($dir.”/”.$file,$dir.”/”.$transl_file);
echo “old: $dir/$file – new: $dir/$transl_file</br>”;
}
// это попытка сделать рекурсию, которая перебирает все вложенные папки
$dir1 = “$dir/$transl_file”;
if (is_dir($dir1)) {
tansl($dir1);
}
}
}
closedir($handle);
}
}
tansl(getcwd());
?>
http://blog.harrix.org/article/186 – крутой плагин для массовой работы с текстом к notepad++.
MiMe tools – URL decode – декодирование URL в кирилицу.
1. Сначала сделаем каждую ссылку отдельной строкой. Для этого в «поиске- заменить» вводим в поле «найти» : http в поле»заменить» \nhttp. Режим поиска ставим «Расширенный». Нажимаем «Заменить все». Мы получили ссылки в отдельных строках.
2. Выделяем регулярными выражениями (http)(.*)(jpg) все ссылки (поиск-пометки) ставим галочку «Помечать закладки». Редактор выделяет все сторик начинающие с httpи заканчивающие jpg
3. Далее нам нужно скопировать строки помеченные закладкой. Для этого в меню выбираем Поиск- Управление закладками- Копировать все строки с закладкой. Все готов, в буфере мы имеем список ссылок. Далее вставляем куда вам угодно.
Синтаксиси регулярных выражений Notepad++:
. – Точка представляет один любой символ
[abc] – перечень символов. Совпадёт с буквами a, b, или с
[^abc] – перечень символов, которые не входят в диапазон. Совпадёт с любым символом, кроме a, b, или с
* — «Повторитель». Означает, что предшествующий символ может повторяться (0 или более раз)
[abc]* — найдёт идущие подряд символы из набора. Например, abracadabra
[^abc]* — с точностью до наоборот. abracadabrrra
.* — Абсолютно любой набор символов. «.*» – найдёт все подстроки между кавычками
^ — начало строки (если исп. В начале выражения)
$ — конец строки
\w – буква, цифра или подчёркивание _
\d – Любая цифра
\D – Любой символ, но не цифра
[0-9] – Любая цифра
[a-z] – Любая буква от a до z (весь латинский набор символов) в нижнем регистре
[A-Z] – Любая буква от a до z в ВЕРХНЕМ регистре
[a-zA-Z] – Любая буква от a до z в любом регистре
[a-Z] — То же самое
([а-яА-Я]) — выделяет все русские буквы
([а-яА-Я]+) — выделяет все русские слова
Решил собирать сам семантику и довольно сильно упоролся на этой теме, что сожрало много времени. Но надеюсь в будущем и сэкономит много. Вот мой ответ на вопрос о полном парсинге wordstat, глубже 40-й страницы:
!диабет – собирать не стоит, минусованием словоформ из основного слова чаще всего не раскрывают полностью “жирные слова”. Проще сразу “фразовой ёлочкой” делать. Так быстрей и понятней.
Делаешь ёлочку от 2-х словной до 7 словной:
“диабет диабет”
“диабет диабет диабет”
“диабет диабет диабет диабет”
“диабет диабет диабет диабет диабет”
“диабет диабет диабет диабет диабет диабет”
“диабет диабет диабет диабет диабет диабет диабет”
Потом проверяешь каждую часть “ёлочки” на то, что она не уходит за пределы 40 страниц wordstat. Если уходит – раскладываешь на словоформы. “диабет диабет” делишь на:
“!диабет диабет”
“!диабета диабет”
“!диабету диабет”
“!диабетом диабет”
“!диабете диабет”
Если и словоформы по фразам не вытягиваю всего и остаются фразы за пределами 40й страницы. Добавляешь минусование основных слов из текущих словосочетаний, предварительно добавив минусуемые словосочетания в явный сбор. Это может выглядеть так:
“!диабета диабет” -!сахарного -!сахарный -!сахарная
“!диабета -!сахарного”
“!диабета -!сахарный”
“!диабета -!сахарная”
Тогда полный список для сбора в один проход может выглядеать так:
“!диабет диабет”
“!диабета диабет” -!сахарного -!сахарный -!сахарная
“!диабета !сахарного”
“!диабета !сахарный”
“!диабета !сахарная”
“!диабету диабет”
“!диабетом диабет”
“!диабете диабет”
“диабет диабет диабет”
“диабет диабет диабет диабет”
“диабет диабет диабет диабет диабет”
“диабет диабет диабет диабет диабет диабет”
“диабет диабет диабет диабет диабет диабет диабет”
Всё это пока не “достигнешь дна” в 40 страниц или пока частотка интересующая тебя не закончится на 40 странице по каждой строке списка. Если не заканчивается – надо ещё бить на подфразы. На это уходит до получаса времени, но позволяет всё выгрести в один проход и экономит время на парсинг в разы, а ещё ресурсы анти-капчи.
Вот ещё пример:
https://wordstat.yandex.ru/#!/?page=40®ions=1&words=ТЕКСТ_ДЛЯ_ПРОВЕРКИ_40_СТРАНИЦЫ
“!видеонаблюдение видеонаблюдение”
“видеонаблюдение видеонаблюдение” -!видеонаблюдение
“!видеонаблюдение видеонаблюдение видеонаблюдение” -камера -цена -купить -как -в -где -для
“!видеонаблюдение видеонаблюдение видеонаблюдение” +камера
“!видеонаблюдение видеонаблюдение видеонаблюдение” +цена
“!видеонаблюдение видеонаблюдение видеонаблюдение” +купить
“!видеонаблюдение видеонаблюдение видеонаблюдение” +как
“!видеонаблюдение видеонаблюдение видеонаблюдение” +в
“!видеонаблюдение видеонаблюдение видеонаблюдение” +где
“!видеонаблюдение видеонаблюдение видеонаблюдение” +для
“!видеонаблюдения видеонаблюдение видеонаблюдение” -!видеонаблюдение -как -где -в -для -купить -цена -камера
“!видеонаблюдения видеонаблюдение видеонаблюдение” -!видеонаблюдение +как
“!видеонаблюдения видеонаблюдение видеонаблюдение” -!видеонаблюдение +где
“!видеонаблюдения видеонаблюдение видеонаблюдение” -!видеонаблюдение +в
“!видеонаблюдения видеонаблюдение видеонаблюдение” -!видеонаблюдение +для
“!видеонаблюдения видеонаблюдение видеонаблюдение” -!видеонаблюдение +купить
“!видеонаблюдения видеонаблюдение видеонаблюдение” -!видеонаблюдение +цена
“!видеонаблюдения видеонаблюдение видеонаблюдение” -!видеонаблюдение +камера
“видеонаблюдение видеонаблюдение видеонаблюдение” -!видеонаблюдение -!видеонаблюдения
“!видеонаблюдение видеонаблюдение видеонаблюдение видеонаблюдение”
“видеонаблюдение видеонаблюдение видеонаблюдение видеонаблюдение” -!видеонаблюдение
“!видеонаблюдение видеонаблюдение видеонаблюдение видеонаблюдение видеонаблюдение”
“видеонаблюдение видеонаблюдение видеонаблюдение видеонаблюдение видеонаблюдение” -!видеонаблюдение
“видеонаблюдение видеонаблюдение видеонаблюдение видеонаблюдение видеонаблюдение видеонаблюдение”
“видеонаблюдение видеонаблюдение видеонаблюдение видеонаблюдение видеонаблюдение видеонаблюдение видеонаблюдение”
Список бирж, которыми я пользуюсь.
https://www.etxt.ru/?r=dsa046
http://advego.ru/3b8PRVNsum
https://text.ru/tteexxtt
https://freelancehunt.com/r/ZOnMM
http://free-lance.ua/?refid=dsa
История А записей домена: http://viewdns.info/iphistory/
Диагностика DNS http://dnscheck.iis.se/
Много других WEB утилит: https://serverfault.com/questions/325190/can-you-lookup-a-domains-past-nameserver-mx-record-history