![]() |
|
Курилка Автомобили, хобби, спорт. И Garik77 с металлоискателем. Коммерция запрещена. |
![]() |
|
Опции темы |
![]() |
#191 | |||
Senior Member
Доцент
Регистрация: 23.06.2020
Сообщений: 490
Сказал(а) спасибо: 1,926
Получил(а) "Спасибо": 2,516
Нарушения: 0/0 (0)
Репутация: 80425
|
![]() Цитата:
Цитата:
Поразительно. С такой логикой прочитать книгу Война и мир будет быстрее чем этот пост. Ты реально не понимаешь, что чем больше операций тем больше времени? Цитата:
И да твоя регулярка выше 100% работать по условию задачи не будет. |
|||
![]() |
![]() |
![]() |
#192 | ||
попробуй отними
Профессор
Регистрация: 14.07.2020
Сообщений: 905
Сказал(а) спасибо: 1,099
Получил(а) "Спасибо": 2,159
Нарушения: 0/0 (0)
Репутация: 757769
|
![]()
там где-то написано что мне надо его извлечь?
мне необходим ответ да/нет Цитата:
Цитата:
вот ради интереса возьми и посчитай количество строк в таблице стандартной функцией и с помощью счётчика её надо немного исправить, в данном виде она будет корректно отрабатывать в 90% случаев при условии что группы цифр начинаются с пробельного символа (это как раз достаточно легко исправить), но есть ещё один момент - необходимо разбить на более мелкие маски поиска по 1-3 цифры и использовать просмотр вперёд ![]() |
||
![]() |
![]() |
![]() |
#193 |
Senior Member
Доцент
Регистрация: 23.06.2020
Сообщений: 490
Сказал(а) спасибо: 1,926
Получил(а) "Спасибо": 2,516
Нарушения: 0/0 (0)
Репутация: 80425
|
![]()
ага останавливают время, бегают в параллельную вселенную за результатом. Твои готовые функции универсальны. Библиотека для регулярок это десятки других библиотек и тысячи строк кода.
Достал короче ты меня, пришлось тест запускать. ![]() Для теста было дано 105 тыс. строк, 7.5 млн символов Рабочий код выше, который уделает любое регулярное выражение, с посимвольным прогоном занял 506 мс. Просто прогон по строкам регуляркой от бурундука, которая нифига не работает занял 18 сек 706 мс. Допиливание до работоспособного состояния еще увеличит время. burunduk, будешь дальше с фактами спорить и фантазировать? Еще раз может пропустил 0.5 и 18.7 секунд. |
![]() |
![]() |
![]() |
#194 |
Позитив =)
Академик
Регистрация: 21.06.2020
Адрес: Санкт-Петербург
Сообщений: 4,412
Сказал(а) спасибо: 25,091
Получил(а) "Спасибо": 13,926
Нарушения: 0/0 (0)
Репутация: 1412767
|
![]()
Драка будет?
![]() |
![]() |
![]() |
![]() |
#195 |
Администратор
Аспирант
Регистрация: 14.06.2020
Сообщений: 86
Сказал(а) спасибо: 387
Получил(а) "Спасибо": 3,983
Нарушения: 0/0 (0)
Репутация: 791207
|
![]() |
![]() |
![]() |
2 пользователя(ей) сказали cпасибо: |
![]() |
#196 |
Позитив =)
Академик
Регистрация: 21.06.2020
Адрес: Санкт-Петербург
Сообщений: 4,412
Сказал(а) спасибо: 25,091
Получил(а) "Спасибо": 13,926
Нарушения: 0/0 (0)
Репутация: 1412767
|
![]() |
![]() |
![]() |
![]() |
#197 |
Администратор
Аспирант
Регистрация: 14.06.2020
Сообщений: 86
Сказал(а) спасибо: 387
Получил(а) "Спасибо": 3,983
Нарушения: 0/0 (0)
Репутация: 791207
|
![]() |
![]() |
![]() |
Сказали спасибо: |
![]() |
#198 |
попробуй отними
Профессор
Регистрация: 14.07.2020
Сообщений: 905
Сказал(а) спасибо: 1,099
Получил(а) "Спасибо": 2,159
Нарушения: 0/0 (0)
Репутация: 757769
|
![]() |
![]() |
![]() |
![]() |
#199 |
Senior Member
Доцент
Регистрация: 23.06.2020
Сообщений: 490
Сказал(а) спасибо: 1,926
Получил(а) "Спасибо": 2,516
Нарушения: 0/0 (0)
Репутация: 80425
|
![]()
Ага код виноват, да гранаты у меня не той системы
![]() ![]() Код:
std::smatch result; int i, cnt = strl.size(); std::regex phone_regex("(^|\\s)((8|\\+7)[\\- ]?)?(\\(?\\d{3}\\)?[\\- ]?)?[\\d\\- ]{10}(\\s|$)"); for (i = 0; i < cnt; i++) std::regex_search(strl[i], result, phone_regex); |
![]() |
![]() |
![]() |
#200 |
ОПТимизирую оптом.
Академик
Регистрация: 26.06.2020
Сообщений: 1,182
Сказал(а) спасибо: 1,474
Получил(а) "Спасибо": 3,201
Нарушения: 0/0 (0)
Репутация: 903053
|
![]()
Для знатоков вопрос. Есть более простая задача. Без регулярок даже.
Имеется текстовый файл 9,5 Гб. объемом. В файле 360 млн. строк. Это база запросов в Гугл на англ. языке за несколько лет. Задача: Быстро сделать выборку из файла примерно по 100 тыс. вхождений. В основном это однословные вхождения (ключи). Вбиваем для выборки viagra к примеру, а оно нам выдает: buy viagra, online viagra и т.д. - все ключи с вхождением этого слова. При небольшом количестве запросов все реально сделать на домашнем компе при помощи KeyWordKeeper - эта программа сеошникам хорошо известна. Также хорошо работает Penguin Keywords Tools, но не на много быстрее. Но нужно, чтобы выборка прошла по 100 тыс. однословных ключей. Пока лучший результат получен при помощи системной утилиты grep на линуксовой машине 8 CPU 16 Гб. Ram на процессоре Райзен. При загрузке процессора на 67% все заняло около суток. Мне тут посоветовали оба файла загрузить в БД SqlLite3 и делать выборку уже в базе. Даже скрипт на python прислали. Вроде так быстрее, хотя я не уверен. Пока предложенный код в базу не грузит ничего. Хотя код запускается норм. Вопрос такой - реально ли через БД быстрее будет? Или это враки. Разработчик уверял, что скорость выборки до 20-ти млн. ключей в секунду. И если ТЗ грамотно составить, что может предложить ИИ по этому вопросу? |
![]() |
![]() |
![]() |
Опции темы | |
|
|
![]() |
||||
Тема | Автор | Раздел | Ответов | Последнее сообщение |
Отзывы: литературный конкурс "Первый 2024-ый, святочный"" | valergapeev | Курилка | 113 | 02.02.2024 20:50 |
Литературный конкурс "Первый 2024-ый, святочный"" | valergapeev | Курилка | 11 | 23.01.2024 21:42 |
Мегафон, тарифы "зеленый" и "звони легко", безлимит от 60 рублей в месяц | dobroset | Биржа услуг | 16 | 19.03.2023 23:49 |
Ну и зачем сделали все подразделы "Не про работу" только для активных пользователей? | Кокетыч | О форуме | 113 | 23.07.2020 17:28 |